北航數(shù)理統(tǒng)計(jì)大作業(yè)(逐步回歸)_第1頁(yè)
北航數(shù)理統(tǒng)計(jì)大作業(yè)(逐步回歸)_第2頁(yè)
北航數(shù)理統(tǒng)計(jì)大作業(yè)(逐步回歸)_第3頁(yè)
北航數(shù)理統(tǒng)計(jì)大作業(yè)(逐步回歸)_第4頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、應(yīng)用數(shù)理統(tǒng)計(jì)第一次大作業(yè)學(xué)號(hào): 姓名: 班級(jí): B11班 2015年12月歡迎下載民航客運(yùn)量的多元線性回歸分析摘要:本文為建立以民航客運(yùn)量為因變量的多元線性回歸模型,選取了1996年至2013年的統(tǒng)計(jì)數(shù)據(jù),包含國(guó)民生產(chǎn)總值,民航航線里程,過夜入境旅游人數(shù),城鎮(zhèn)居民可支配收入等因素,利用統(tǒng)計(jì)軟件SPSS對(duì)各因素進(jìn)行了篩選分析,采用逐步回歸法得到最優(yōu)多元線性回歸模型,并對(duì)模型的回歸顯著性、擬合度以及隨機(jī)誤差的正態(tài)性進(jìn)行了檢驗(yàn),并采用2014年的數(shù)據(jù)進(jìn)行檢驗(yàn),得到的結(jié)果達(dá)到預(yù)期,證明該模型建立是較為成功的。關(guān)鍵詞:多元線性回歸,逐步回歸法,民航客運(yùn)量0.符號(hào)說明變量符號(hào)民用航空客運(yùn)量Y國(guó)民生產(chǎn)總值X

2、1鐵路客運(yùn)量X2民航航線里程X3入境過夜旅游人數(shù)X4城鎮(zhèn)居民人均可支配收入X51.引言隨著社會(huì)的進(jìn)步,人民生活水平的提高,如何獲得更快捷方便的交通成為人們?nèi)找骊P(guān)注的問題。因?yàn)楹娇盏陌踩?,快速且價(jià)格水平越來越傾向大眾,越來越多的人們選擇航空這種交通方式。近年來,我國(guó)的航空客運(yùn)量已經(jīng)進(jìn)入世界前列,為掌握航空客運(yùn)的動(dòng)態(tài),合理安排班機(jī)數(shù)量。科學(xué)地對(duì)我國(guó)民航客運(yùn)量的影響因素的分析,并得出其回歸方程,進(jìn)而能夠估計(jì)航空客運(yùn)量是非常有必要的。本文收集整理了與我國(guó)航空客運(yùn)量相關(guān)的歷年數(shù)據(jù),運(yùn)用SPSS軟件對(duì)數(shù)據(jù)進(jìn)行分析,研究1996年起至2013年我國(guó)民航客運(yùn)量y(萬人)與國(guó)民生產(chǎn)總值X1(億元)、鐵路客運(yùn)量

3、X2(萬人)、民航航線里程X3(萬公里)、入境過夜旅游人數(shù)X4(萬人)、城鎮(zhèn)居民人均可支配收入X5(元)的關(guān)系。采用逐步回歸法建立線性模型,選出較優(yōu)的線性回歸模型。2.數(shù)據(jù)的統(tǒng)計(jì)與分析本文在進(jìn)行統(tǒng)計(jì)時(shí),查閱中國(guó)統(tǒng)計(jì)摘要,中國(guó)統(tǒng)計(jì)年鑒2014以及中國(guó)知網(wǎng)數(shù)據(jù)查詢中的數(shù)據(jù),收集了1996年至2013年各個(gè)自變量因素的數(shù)據(jù),分析它們之間的聯(lián)系。整理如表1所示。表1:年份民航客運(yùn)量(萬人)國(guó)內(nèi)生產(chǎn)總值(億元)鐵路客運(yùn)量(萬人)民航航線里程(萬公里)入境過夜旅游人數(shù)(萬人)城鎮(zhèn)居民可支配收入(元)199655557897394797116.651356.264838.91997563084402.393

4、308142.51578.535160.31998575589677.195085150.581692.455425.11999609488479.2100164152.221765.255854.12000672299214.6105073150.291750.966280.120017524109655.2105155155.361880.366859.620028594120332.7105606163.772012.457702.820038759135822.897260174.952033.588472.2200412123159878.3111764204.942519.8994

5、21.6200513827184937.4115583199.852925.6310493.1200615968216314.4125656211.353486.4511759.5200718576265810.3135670234.33398.5813785.8200819251314045.4146193246.183696.7115780.8200923052340506.9152451234.514025.9617174.7201026769397983.5168145276.54753.8419109.4201129316473104146192349.054924.3221809.

6、8201231896519470.1189337328.015668.6324564.7201335397568845.2210597410.65562.3926955.12.1模型的建立以民航客運(yùn)量y為因變量,以上5種影響因素為自變量Xi ,構(gòu)建回歸方程: y=0+iXi+其中0為常數(shù)項(xiàng),為誤差項(xiàng)。先觀察自變量與因變量的關(guān)系,用SPSS得到各個(gè)自變量與因變量的散點(diǎn)圖:圖1 民航客運(yùn)量與國(guó)內(nèi)生產(chǎn)總值散點(diǎn)圖圖2 民航客運(yùn)量與鐵路客運(yùn)量散點(diǎn)圖圖3 民航客運(yùn)量與航線里程散點(diǎn)圖圖4 民航客運(yùn)量與入境過夜人數(shù)散點(diǎn)圖圖5 民航客運(yùn)量與人均可支配收入散點(diǎn)圖從以上五張散點(diǎn)圖,我們可以看出因變量民航客運(yùn)量與國(guó)內(nèi)

7、生產(chǎn)總值,入境過夜旅游人數(shù)和城鎮(zhèn)居民人均可支配收入均有較好的線性關(guān)系,這說明建立線性模型是有意義的。繼續(xù)下一步逐步回歸分析,逐步回歸的基本思想是將變量逐個(gè)引入模型,每引入一個(gè)變量后都要進(jìn)行F檢驗(yàn),并對(duì)已經(jīng)選入的變量逐個(gè)進(jìn)行t檢驗(yàn),當(dāng)原來引入的變量由于后面變量的引入變得不再顯著時(shí),則將其刪除。以確保每次引入新的變量之前回歸方程中只包含先主動(dòng)變量。這是一個(gè)反復(fù)的過程,直到既沒有顯著的變量選入回歸方程,也沒用不顯著的變量從回歸方程中剔除為止。在SPSS軟件中可直接進(jìn)行逐步回歸分析,得出以下結(jié)果:由表2知,逐步回歸后得出兩個(gè)模型,模型1只包含城鎮(zhèn)居民可支配收入,其他自變量都沒有進(jìn)入模型,模型2在1的基

8、礎(chǔ)上再納入了過夜入境旅游人數(shù),其他的自變量也都被排除了。表2輸入移去的變量a模型輸入的變量移去的變量方法1城鎮(zhèn)居民人均可支配收入.步進(jìn)(準(zhǔn)則: F-to-enter 的概率 = .100)。2過夜游客.步進(jìn)(準(zhǔn)則: F-to-enter 的概率 = .100)。a. 因變量: 民用航空客運(yùn)量表3已排除的變量a模型Beta IntSig.偏相關(guān)共線性統(tǒng)計(jì)量容差1國(guó)內(nèi)生產(chǎn)總值.197b.517.612.132.003鐵路客運(yùn)量-.001b-.014.989-.004.058民航航線里程-.040b-.388.704-.100.044過夜游客.421b3.432.004.663.0182國(guó)內(nèi)生產(chǎn)總值

9、.306c1.059.308.272.003鐵路客運(yùn)量-.020c-.289.777-.077.058民航航線里程.011c.138.892.037.043a. 因變量: 民用航空客運(yùn)量b. 模型中的預(yù)測(cè)變量: (常量), 城鎮(zhèn)居民人均可支配收入。c. 模型中的預(yù)測(cè)變量: (常量), 城鎮(zhèn)居民人均可支配收入, 過夜游客。表4模型匯總c模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計(jì)的誤差更改統(tǒng)計(jì)量R 方更改F 更改df1df2Sig. F 更改1.996a.993.992876.7400.9932183.841116.0002.998b.996.995677.6913.00311.779115.004a.

10、預(yù)測(cè)變量: (常量), 城鎮(zhèn)居民人均可支配收入。b. 預(yù)測(cè)變量: (常量), 城鎮(zhèn)居民人均可支配收入, 過夜游客。c. 因變量: 民用航空客運(yùn)量2.2擬合度檢驗(yàn)由表4,模型1的決定系數(shù)R2=0.992,模型2的決定系數(shù)R2=0.995,可以看出回歸方程都高度顯著,且模型2比模型1更優(yōu)。2.3回歸方程的顯著性檢驗(yàn):由表5,方差分析表Sig值都0.05,說明每個(gè)模型都拒絕回歸系數(shù)均為0的假設(shè),每個(gè)方程都是顯著的。表5Anovaa模型平方和df均方FSig.1回歸1678659397.18411678659397.1842183.841.000b殘差12298767.26116768672.954總

11、計(jì)1690958164.444172回歸1684069181.3702842034590.6851833.437.000c殘差6888983.07515459265.538總計(jì)1690958164.44417a. 因變量: 民用航空客運(yùn)量b. 預(yù)測(cè)變量: (常量), 城鎮(zhèn)居民人均可支配收入。c. 預(yù)測(cè)變量: (常量), 城鎮(zhèn)居民人均可支配收入, 過夜游客。由表6可以得到兩個(gè)模型的回歸方程分別:1. 以城鎮(zhèn)居民可支配收入為自變量的擬合函數(shù): y=-1698.669+1.406X52. 以城鎮(zhèn)居民可支配收入和過夜入境旅游人數(shù)為自變量的擬合函數(shù): y=-3267.728+0.817X5+2.871X

12、4且所有系數(shù)的顯著性水平都小于0.05,每個(gè)回歸方程都是有意義的。表6系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B標(biāo)準(zhǔn) 誤差試用版1(常量)-1698.669423.955-4.007.001城鎮(zhèn)居民人均可支配收入1.406.030.99646.732.0002(常量)-3267.728562.492-5.809.000城鎮(zhèn)居民人均可支配收入.817.173.5794.721.000過夜游客2.871.837.4213.432.004a. 因變量: 民用航空客運(yùn)量表7是殘差統(tǒng)計(jì)結(jié)果。主要顯示預(yù)測(cè)值、標(biāo)準(zhǔn)化預(yù)測(cè)值、殘差和標(biāo)準(zhǔn)化殘差等統(tǒng)計(jì)量的最大值、最小值、均值和標(biāo)準(zhǔn)差。殘差平方和Q描述的是隨機(jī)誤差

13、引起因變量Y的分散程度,Q越大分散性也越大,則線性關(guān)系越不明顯。由表7可見標(biāo)準(zhǔn)化殘差的最大絕對(duì)值為1.758。而且標(biāo)準(zhǔn)殘差的均值為0,說明隨機(jī)誤差對(duì)Y值的影響很小。表7殘差統(tǒng)計(jì)量a極小值極大值均值標(biāo)準(zhǔn) 偏差N預(yù)測(cè)值4581.80435339.83615600.4449953.034418殘差-1191.5225973.1963.0000636.580218標(biāo)準(zhǔn) 預(yù)測(cè)值-1.1071.983.0001.00018標(biāo)準(zhǔn) 殘差-1.7581.436.000.93918a. 因變量: 民用航空客運(yùn)量2.4多重共線性的診斷表8共線性診斷a模型維數(shù)特征值條件索引方差比例(常量)城鎮(zhèn)居民人均可支配收入過夜游

14、客111.8731.000.06.062.1273.843.94.94212.8521.000.01.00.002.1474.410.37.01.003.00239.683.62.991.00a. 因變量: 民用航空客運(yùn)量表8是SPSS軟件的多重共線性診斷表,它包括3項(xiàng)診斷值:特征值、條件數(shù)和方差比率。特征值表明在自變量中存在多少截然不同的維數(shù),當(dāng)幾個(gè)特征值都接近0是,變量是高度相關(guān)的。條件數(shù)是最大特征值對(duì)每一個(gè)連續(xù)特征值的比率的平方根,若條件數(shù)大于15則表明可能存在多重共線問題,若大于30則表明存在嚴(yán)重的多重共線性問題。顯然表8中變量X4過夜入境旅游人數(shù)的條件數(shù)大于30,說明回歸方程存在多重

15、共線性。2.5殘差檢驗(yàn)如圖6是殘差分布直方圖。在回歸分析中,總是假定殘差服從正態(tài)分布,這個(gè)圖就是根據(jù)樣本數(shù)據(jù)的計(jì)算結(jié)果顯示殘差分析的實(shí)際情況。從圖來看標(biāo)準(zhǔn)化殘差還是近似服從正態(tài)分布的。圖6如圖7殘差的積累概率圖基本圍繞在假設(shè)直線 (正態(tài)分布)周圍,說明殘差分布基本符合正態(tài)分布,說明民航客運(yùn)量這個(gè)因變量基本上可以用線性回歸方法建立模型。3.結(jié)論為了解決多重共線性的問題,排除模型2,考慮到模型1的擬合度也是很好的,綜合來看認(rèn)為模型1為更優(yōu)。最終得到的回歸方程為:y=-1698.669+1.406X5并以2014年的數(shù)據(jù)檢驗(yàn)該回歸方程,2014年航空客運(yùn)量為39195萬人,城鎮(zhèn)居民人均可支配收入為28843.9,將自變量X5帶入回歸方程得到y(tǒng)=38855.85萬人,與實(shí)際的客

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論