回歸線性的分析_第1頁(yè)
回歸線性的分析_第2頁(yè)
回歸線性的分析_第3頁(yè)
回歸線性的分析_第4頁(yè)
回歸線性的分析_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、摘 要 . 本文通過(guò)利用spss,eviews,以及matlab等數(shù)學(xué)軟件對(duì)已知數(shù)據(jù)進(jìn)行處理,首先用箱圖進(jìn)行分析,進(jìn)而檢測(cè)出了強(qiáng)影響點(diǎn),得出杠桿值。其次,從回歸殘差的直方圖與附于圖上的正態(tài)分布曲線相比較,來(lái)驗(yàn)證正態(tài)分布。最后,從相關(guān)系數(shù)觀察變量之間是否線性相關(guān),由相關(guān)系數(shù)矩陣來(lái)檢驗(yàn)自變量是否多重共線性。關(guān)鍵詞:線性回歸分析 線性相關(guān)關(guān)系 強(qiáng)影響點(diǎn) 杠桿值 殘差分析多重共線性一 問(wèn)題重述根據(jù)所給的數(shù)據(jù)作如下的回歸分析:要求:1.檢測(cè)強(qiáng)影響點(diǎn),并求出杠桿值. 2.正態(tài)性檢驗(yàn). 3.相關(guān)性檢驗(yàn). 4.自變量的多重共線性檢測(cè),若有多重共線性,試消除,再建模. 5.,分析,模型的合理性分析. 6.預(yù)測(cè)時(shí)

2、的預(yù)測(cè)值.二.問(wèn)題分析 這是一個(gè)關(guān)于線性回歸分析的問(wèn)題,題目中我們對(duì)強(qiáng)影響點(diǎn),杠桿值,正態(tài)性檢驗(yàn). 相關(guān)性檢驗(yàn),.自變量的多重共線性檢測(cè),殘差的自相關(guān)性等問(wèn)題進(jìn)行了分析,如何尋找各變量之間的關(guān)系,建立模型是至關(guān)重要的,對(duì)此,我們利用spss,eviews,以及matlab等數(shù)學(xué)軟件對(duì)已知數(shù)據(jù)進(jìn)行處理,尋找各變量之間的關(guān)系,建立符合要求的函數(shù)模型。三.模型假設(shè)各變量的數(shù)據(jù)與所給的表格中的信息一致。四定義與符號(hào)說(shuō)明表示全部樣本的預(yù)測(cè)值表示把第i個(gè)樣本刪掉的預(yù)測(cè)值表示為P的主對(duì)角元,成為杠桿值五.模型的建立與求解問(wèn)題一:檢測(cè)強(qiáng)影響點(diǎn),并求出杠桿值.用spss軟件做如下的箱圖可直觀的得到有三個(gè)強(qiáng)影響點(diǎn)

3、,分別為3,12,34。 圖一:箱圖圖二由上圖可以看出標(biāo)記為3,12,34的點(diǎn)為強(qiáng)影點(diǎn),它們的cooks值為:Cook距離為: 上面的矩陣對(duì)角線上的數(shù)字即為這幾個(gè)變量的cooks值。、問(wèn)題二.正態(tài)性檢驗(yàn).圖三圖三為觀測(cè)量累計(jì)概率圖,圖的縱坐標(biāo)為Expected Cumulative Probability(期望累計(jì)概率分布),橫坐標(biāo)為 Observed Cumulative Probability(觀測(cè)累計(jì)概率分布)圖中的斜線對(duì)應(yīng)著一個(gè)均值為0的正態(tài)分布。如果圖中的散點(diǎn)密切地散布在這條斜線附近,說(shuō)明隨機(jī)變量殘差 服從正態(tài)分布,從而證明樣本確實(shí)是來(lái)自于正態(tài)總體。如果偏離這條直線太遠(yuǎn),應(yīng)該懷疑隨機(jī)

4、變量的正態(tài)性。由上述散點(diǎn)圖可知 ,40個(gè)散點(diǎn)大致散布于斜線附近 ,因此可以認(rèn)為殘差分布基本上是正態(tài)的。圖四從回歸殘差的直方圖與附于圖上的正態(tài)分布曲線相比較,可知道服從正態(tài)分布分布不是明顯地服從正態(tài)分布。 問(wèn)題三.相關(guān)性檢驗(yàn). ,由上面六個(gè)P-P圖可得X1,X2,X3,X4,X5,X6都是線性的問(wèn)題四.自變量的多重共線性檢測(cè),若有多重共線性,試消除,再建模. (1)檢測(cè)自變量之間存在多重共線性 圖五由圖五中的相關(guān)系數(shù)矩陣可以看出,各變量相互之間的相關(guān)系數(shù)較高,證明確實(shí)存在多重共線性。(2)消除多重共線性  采用逐步回歸的辦法,去檢驗(yàn)和解決多重共線性問(wèn)題。分別做Y對(duì) 的一元回歸,結(jié)果如圖

5、六所示:圖六 圖七  圖八表中顯示逐步回歸過(guò)程所建立的模型中剔除掉的變量后各種變量之間的具體數(shù)值。 新加入X7后各參數(shù)的t檢驗(yàn)顯著,選擇保留 ,再加入其他新變量逐步回歸,問(wèn)題五.模型的合理性分析. 問(wèn)題六 .預(yù)測(cè)時(shí)的預(yù)測(cè)值.由Coefficient知,y=9.122+1.805*X1+2.153*X2+1.683*X3+4.206*X4-1.999*X5+0.170*X6為回歸線性方程,當(dāng)時(shí),的預(yù)測(cè)值為ans =494.9580六.模型的評(píng)價(jià):我們建立的模型總體來(lái)說(shuō)還是比價(jià)合理的,但由于數(shù)據(jù)量不是很大,當(dāng)我們進(jìn)行相關(guān)性,正態(tài)性分析,消除自變量時(shí)導(dǎo)致效果不是很好,從而導(dǎo)致用該模型求預(yù)測(cè)時(shí)誤差大,預(yù)測(cè)的精度不是很高。八參考文獻(xiàn):【1】姜啟源 謝金星 葉俊,數(shù)學(xué)模型,北京:

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論