應(yīng)用回歸_第2章課后習(xí)題參考答案

上傳人：a*** IP屬地：湖北上傳時(shí)間：2021-10-28 格式：DOC 頁(yè)數(shù)：18 大?。?.02MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩13頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2.1 一元線性回歸模型有哪些基本假定？答：1. 解釋變量是非隨機(jī)變量，觀測(cè)值是常數(shù)。2. 等方差及不相關(guān)的假定條件為這個(gè)條件稱為高斯-馬爾柯夫(Gauss-Markov)條件，簡(jiǎn)稱G-M條件。在此條件下，便可以得到關(guān)于回歸系數(shù)的最小二乘估計(jì)及誤差項(xiàng)方差估計(jì)的一些重要性質(zhì)，如回歸系數(shù)的最小二乘估計(jì)是回歸系數(shù)的最小方差線性無(wú)偏估計(jì)等。 3. 正態(tài)分布的假定條件為在此條件下便可得到關(guān)于回歸系數(shù)的最小二乘估計(jì)及估計(jì)的進(jìn)一步結(jié)果，如它們分別是回歸系數(shù)的最及的最小方差無(wú)偏估計(jì)等，并且可以作回歸的顯著性檢驗(yàn)及區(qū)間估計(jì)。4. 通常為了便于數(shù)學(xué)上的處理，還要求及樣本容量的個(gè)數(shù)要多于解釋變量的個(gè)數(shù)。在整

2、個(gè)回歸分析中，線性回歸的統(tǒng)計(jì)模型最為重要。一方面是因?yàn)榫€性回歸的應(yīng)用最廣泛；另一方面是只有在回歸模型為線性的假設(shè)下，才能的到比較深入和一般的結(jié)果；再就是有許多非線性的回歸模型可以通過適當(dāng)?shù)霓D(zhuǎn)化變?yōu)榫€性回歸問題進(jìn)行處理。因此，線性回歸模型的理論和應(yīng)用是本書研究的重點(diǎn)。1. 如何根據(jù)樣本求出及方差的估計(jì);2. 對(duì)回歸方程及回歸系數(shù)的種種假設(shè)進(jìn)行檢驗(yàn)；3. 如何根據(jù)回歸方程進(jìn)行預(yù)測(cè)和控制，以及如何進(jìn)行實(shí)際問題的結(jié)構(gòu)分析。2.2 考慮過原點(diǎn)的線性回歸模型誤差仍滿足基本假定。求的最小二乘估計(jì)。答：令即解得即的最小二乘估計(jì)為2.3 證明：Q (，)= (-)2 因?yàn)镼 (,)=min Q (, )而Q

3、(, ) 非負(fù)且在上可導(dǎo),當(dāng)Q取得最小值時(shí)，有即-2(-)=0 -2(-) =0又=-( +)= - =0， =0（即殘差的期望為0，殘差以變量x的加權(quán)平均值為零）2.4 解：參數(shù)0，1的最小二乘估計(jì)與最大似然估計(jì)在iN(0, 2 ) i=1,2，n的條件下等價(jià)。證明：因?yàn)?所以其最大似然函數(shù)為已知使得Ln（L）最大的，就是，的最大似然估計(jì)值。即使得下式最小：因?yàn)榍『镁褪亲钚《斯烙?jì)的目標(biāo)函數(shù)相同。所以，在的條件下，參數(shù)0，1的最小二乘估計(jì)與最大似然估計(jì)等價(jià)。2.5.證明是的無(wú)偏估計(jì)。證明：若要證明是的無(wú)偏估計(jì)，則只需證明E()=。因?yàn)椋淖钚《斯烙?jì)為其中E()=E(

4、)=E()=E =E =E()+E()+E() 其中=由于=0，所以= =)=0又因?yàn)橐辉€性回歸模型為所以E()=0所以E()+E()+E( = =所以是的無(wú)偏估計(jì)。2.6 解：因?yàn)?，，聯(lián)立式，得到。因?yàn)?，所?2.7 證明平方和分解公式：SST=SSE+SSR證明：2.8 驗(yàn)證三種檢驗(yàn)的關(guān)系，即驗(yàn)證：（1）；（2）證明：（1）因?yàn)?，所以又因?yàn)?，所以?得證。（2）2.9 驗(yàn)證（2.63）式：證明：其中：注：各個(gè)因變量是獨(dú)立的隨機(jī)變量 2.10 用第9題證明是的無(wú)偏估計(jì)量證明：注：2.11驗(yàn)證證明：所以有以上表達(dá)式說明r ²與F 等價(jià)，但我們要分別引入這兩個(gè)統(tǒng)計(jì)

5、量，而不是只引入其中一個(gè)。理由如下：r ²與F，n都有關(guān)，且當(dāng)n較小時(shí)，r較大，尤其當(dāng)n趨向于2時(shí)，|r|趨向于1，說明x與y的相關(guān)程度很高；但當(dāng)n趨向于2或等于2時(shí)，可能回歸方程并不能通過F的顯著性檢驗(yàn)，即可能x與y都不存在顯著的線性關(guān)系。所以，僅憑r較大并不能斷定x與y之間有密切的相關(guān)關(guān)系，只有當(dāng)樣本量n較大時(shí)才可以用樣本相關(guān)系數(shù)r判定兩變量間的相關(guān)程度的強(qiáng)弱。 F檢驗(yàn)檢驗(yàn)是否存在顯著的線性關(guān)系，相關(guān)系數(shù)的顯著性檢驗(yàn)是判斷回歸直線與回歸模型擬合的優(yōu)劣，只有二者結(jié)合起來，才可以更好的回歸結(jié)果的好壞。2.12 如果把自變量觀測(cè)值都乘以2，回歸參數(shù)的最小二乘法估計(jì)和會(huì)發(fā)生什么變化？如果

6、把自變量觀測(cè)值都加上2，回歸參數(shù)的最小二乘估計(jì)和會(huì)發(fā)生什么變化？解: 解法（一）：我們知道當(dāng)，時(shí)，用最小二乘法估計(jì)的和分別為當(dāng)時(shí)有將帶入得到當(dāng)時(shí) 有將帶入得到·解法（二）：當(dāng)，時(shí)，有當(dāng)時(shí) 當(dāng) ，，由最小二乘法可知，離差平方和時(shí)，其估計(jì)值應(yīng)當(dāng)有。即回歸參數(shù)的最小二乘估計(jì)和在自變量觀測(cè)值變化時(shí)不會(huì)變。2.13 如果回歸方程相應(yīng)的相關(guān)系數(shù)r很大，則用它預(yù)測(cè)時(shí)，預(yù)測(cè)誤差一定較小。這一結(jié)論能成立嗎？對(duì)你的回答說明理由。解：這一結(jié)論不成立。因?yàn)橄嚓P(guān)系數(shù)r表示x與線性關(guān)系的密切程度，而它接近1的程度與數(shù)據(jù)組數(shù)有關(guān)。n越小，r越接近1。n=2時(shí)，|r|=1。因此僅憑相關(guān)系數(shù)說明x與有密切

7、關(guān)系是不正確的。只有在樣本量較大時(shí)，用相關(guān)系數(shù)r判定兩變量之間的相關(guān)程度才可以信服，這樣預(yù)測(cè)的誤差才會(huì)較小。2.14 解：（1）散點(diǎn)圖為：（2）x與y大致在一條直線上，所以x與y大致呈線性關(guān)系。（3）得到計(jì)算表：XY1104100206（-14）2（-4）221011001013（-7）2（3）2320000200042010027727254044004034142（-6）2和15100和Lxx=10Lyy=600和Lxy=70和100SSR=490SSE=110均3均20均20 所以回歸方程為：（4）= 所以，（5）因?yàn)?，的置信區(qū)間為；同理，因?yàn)?，所以，的置信區(qū)間為。查表知，所以，的

8、置信區(qū)間為（-21.21,19.21），的置信區(qū)間為（0.91,13.09）。（6）決定系數(shù) （7）計(jì)算得出，方差分析表如下：方差來源平方和自由度均方F值SSR490149013.364SSE110336.667SST6004 查表知，F(xiàn)0.05(1,3)=10.13，F(xiàn)值>F0.05(1,3)，故拒絕原假設(shè)，說明回歸方程顯著。（8）做回歸系數(shù)1的顯著性檢驗(yàn) 計(jì)算t統(tǒng)計(jì)量：查表知，，所以，t>t0.05/2(3)，所以接受原假設(shè)，說明x和Y有顯著的線性關(guān)系。（9）做相關(guān)系數(shù)r的顯著性檢驗(yàn)：因?yàn)?所以，相關(guān)系數(shù) 因?yàn)椴楸碇琻-2等于3時(shí)，%的值為0.959，%的值為0.878

9、。所以，%<|r|<%，故x與y有顯著的線性關(guān)系。（10）殘差表為：序號(hào)殘差111064221013-33320200442027-75540346 殘差圖為：（11）當(dāng)X0=4.2時(shí), 其95%的置信區(qū)間近似為，即為: （17.1，39.7）。2.15解：（1）畫散點(diǎn)圖；圖形舊對(duì)話框散點(diǎn)圖，得到散點(diǎn)圖（表1）如下：（2）x與y之間是否大致呈線性關(guān)系？由上面（1）散點(diǎn)圖可以看出，x與y之間大致呈線性關(guān)系。用最小二乘估計(jì)求出回歸方程；分析回歸線性，得到“回歸系數(shù)顯著性檢驗(yàn)表（表2）”如下：CoefficientsaModelUnstandardized Coeffi

10、cientsStandardized CoefficientstBStd. ErrorBeta1(Constant).118.355.333每周簽發(fā)的新保單數(shù)目x.004.000.9498.509a. Dependent Variable: 每周加班工作時(shí)間y 由上表可知: =0.118 =0.004 所以可得回歸方程為：=0.118+0.004x（4）求回歸標(biāo)準(zhǔn)誤差；分析回歸線性，得到“方析分析表（表3）”如下：ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression16.682116.68272.396.000aResidual1.84

11、38.230Total18.5259a. Predictors: (Constant), 每周簽發(fā)的新保單數(shù)目xb. Dependent Variable: 每周加班工作時(shí)間y 由上表可得， SSE=1.843 n=10 故回歸標(biāo)準(zhǔn)誤差為： =0.23 =0.48（5）給出與的置信度為95%的區(qū)間估計(jì)；由表2可以看出，當(dāng)置信度為95%時(shí)，的預(yù)測(cè)區(qū)間為：-0.701，0.937 的預(yù)測(cè)區(qū)間為：0.003，0.005 （6）計(jì)算x與y的決定系數(shù)；分析回歸線性，得到“模型概要表（表4）”如下：Model SummarybModelRR SquareAdjusted R SquareStd. E

12、rror of the Estimate1.949a.900.888.4800a. Predictors: (Constant), 每周簽發(fā)的新保單數(shù)目xb. Dependent Variable: 每周加班工作時(shí)間y 由上表可知，x與y的決定系數(shù)為0.9，可以看到很接近于1，這就說明此模型的擬合度很好。（7）對(duì)回歸方程作方差分析；由“方差分析表（表3）”可得，F(xiàn)-值=72.396，我們知道，當(dāng)原假設(shè):=0成立時(shí)，F(xiàn)服從自由度為（1，n-2）的F分布（見），臨界值（1，n-2）=（1，8）=5.32 因?yàn)镕-值=72.396>5.32，所以拒絕原假設(shè)，說明回歸方程顯著，即x與y有顯

13、著的線性關(guān)系。（8）做回歸系數(shù)顯著性的檢驗(yàn)；由“回歸系數(shù)顯著性檢驗(yàn)表（表2）”可得，的t檢驗(yàn)統(tǒng)計(jì)量為t=8.509，對(duì)應(yīng)p-值近似為0，p<，說明每周簽發(fā)的新報(bào)單數(shù)目x對(duì)每周加班工作時(shí)間y有顯著的影響。（9）做相關(guān)系數(shù)的顯著性檢驗(yàn)；分析相關(guān)雙變量，得到“相關(guān)分析表（表5）”如下：Correlations每周簽發(fā)的新保單數(shù)目x每周加班工作時(shí)間y每周簽發(fā)的新保單數(shù)目xPearson Correlation1.949*Sig. (2-tailed).000N1010每周加班工作時(shí)間yPearson Correlation.949*1Sig. (2-tailed).000N1010*.

14、Correlation is significant at the 0.01 level (2-tailed). 由上表可知，相關(guān)系數(shù)為0.949，說明x與y顯著線性相關(guān)。（10）對(duì)回歸方程作殘差圖并作相應(yīng)的分析；從上圖可以看出，殘差是圍繞e=0隨即波動(dòng)的，滿足模型的基本假設(shè)。（11）該公司預(yù)計(jì)下一周簽發(fā)新保單=1000張，需要的加班時(shí)間是多少？當(dāng)=1000張時(shí),=0.118+0.004×1000=4.118小時(shí)。（12）給出的置信水平為95%的精確預(yù)測(cè)區(qū)間和近似預(yù)測(cè)區(qū)間。（13）給出E（）置信水平為95%的區(qū)間估計(jì)。最后兩問一起解答：在計(jì)算回歸之前，把自變量新值輸入樣本數(shù)據(jù)

15、中，因變量的相應(yīng)值空缺，然后在Save對(duì)話框中點(diǎn)選Individul和Mean計(jì)算因變量單個(gè)新值和因變量平均值E()的置信區(qū)間。結(jié)果顯示在原始數(shù)據(jù)表中，如下圖所示(由于排版問題，中間部分圖省略): 的精確預(yù)測(cè)區(qū)間為：2.519，4.887 E（）的區(qū)間估計(jì)為：3.284，4.123而的近似預(yù)測(cè)區(qū)間則根據(jù)2手動(dòng)計(jì)算，結(jié)果為： 4.118-2×0.48，4.118+2×0.48=3.158，5.078 2.16 解答：（1）繪制y對(duì)x的散點(diǎn)圖，可以用直線回歸描述兩者之間的關(guān)系嗎？如圖所示：（2）由上圖可以看出，y與x的散點(diǎn)分布大致呈直線趨勢(shì)，所以可以用直線回歸描述兩者之間的關(guān)系

16、。（3）建立y對(duì)x的線性回歸。利用SPSS建立y對(duì)x的線性回歸，輸出結(jié)果如下：表1 模型匯總模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計(jì)的誤差1.835a.697.6912323.256a. 預(yù)測(cè)變量: (常量), x。表2 方差分析表Anovab模型平方和df均方FSig.1回歸6.089E816.089E8112.811.000a殘差2.645E8495397517.938總計(jì)8.734E850a. 預(yù)測(cè)變量: (常量), x。b. 因變量: y 表3 系數(shù)表系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B標(biāo)準(zhǔn) 誤差試用版1(常量)12112.6291197.76810.113.000x3.314.312.83510.621.000a. 因變量: y（a）由表1可知，x與y決定系數(shù)為，說明模型的擬合效果一般。x與y線性相關(guān)系數(shù)R=0.

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

應(yīng)用回歸_第2章課后習(xí)題參考答案

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

應(yīng)用回歸_第2章課后習(xí)題參考答案

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔