重慶大學(xué)數(shù)理統(tǒng)計(jì)大作業(yè)_第1頁
重慶大學(xué)數(shù)理統(tǒng)計(jì)大作業(yè)_第2頁
重慶大學(xué)數(shù)理統(tǒng)計(jì)大作業(yè)_第3頁
重慶大學(xué)數(shù)理統(tǒng)計(jì)大作業(yè)_第4頁
重慶大學(xué)數(shù)理統(tǒng)計(jì)大作業(yè)_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、2015-2016年第二學(xué)期研究生“應(yīng)用數(shù)理統(tǒng)計(jì)”課程課外作業(yè)研究生課程考核試卷(適用于課程論文、提交報(bào)告)科 目: 數(shù)理統(tǒng)計(jì) 教 師: 劉瓊蓀 姓 名: xxx 學(xué) 號(hào): 20150702xxx 專 業(yè): 機(jī)械工程 類 別: 學(xué)術(shù) 上課時(shí)間: 2016 年 3 月至 2016 年 4 月 考 生 成 績:卷面成績平時(shí)成績課程綜合成績閱卷評語: 閱卷教師 (簽名) 我國上世紀(jì)70-90年代民航客運(yùn)量回歸分析摘要:中國民航從上實(shí)際50年代發(fā)展至今已有60多年的歷史,這期間中國民航經(jīng)歷了曲折的發(fā)展。隨著改革開發(fā)以來,中國人民的生活水平日漸提高,出行坐乘飛機(jī)逐漸人們可選的交通方式。我國民航客運(yùn)量逐年

2、提高,為了研究其歷史變化趨勢及其成因,現(xiàn)以民航客運(yùn)量作為因變量y,假設(shè)以國民收入x1、消費(fèi)額x2、鐵路客運(yùn)量x3、民航航線里程x4、來華旅游入境人數(shù)x5為影響民航客運(yùn)量的主要因素。利用spss和excel軟件通過建立回歸模型分析我國民航客運(yùn)量主要受到其中哪些因素的影響,并就回歸模型分析具體可能的成因。關(guān)鍵詞:民航客運(yùn)量 影響因素 回歸模型一、問題提出及問題分析2004年,民航行業(yè)完成運(yùn)輸總周轉(zhuǎn)量230億噸公里、旅客運(yùn)輸量1.2億人、貨郵運(yùn)輸量273萬噸、通用航空作業(yè)7.7萬小時(shí)。截止2004年底,我國定期航班航線達(dá)到1200條,其中國內(nèi)航線(包括香港、澳門航線)975條,國際航線225條,境內(nèi)

3、民航定期航班通航機(jī)場133個(gè)(不含香港、澳門),形成了以北京、上海、廣州機(jī)場為中心,以省會(huì)、旅游城市機(jī)場為樞紐,其它城市機(jī)場為支干,聯(lián)結(jié)國內(nèi)127個(gè)城市,聯(lián)結(jié)38個(gè)國家80個(gè)城市的航空運(yùn)輸網(wǎng)絡(luò)。民航機(jī)隊(duì)規(guī)模不斷擴(kuò)大,截止至2004年底,中國民航擁有運(yùn)輸飛機(jī)754架,其中大中型飛機(jī)680架,均為世界上最先進(jìn)的飛機(jī)。2004年中國民航運(yùn)輸總周轉(zhuǎn)量達(dá)到230億噸公里(不包括香港、澳門特別行政區(qū)以及臺(tái)灣省),在國際民航組織188個(gè)締約國中名列第3位。從上述事實(shí)可以看出我國民航的發(fā)展所取得的成果顯著。當(dāng)前我國民航客運(yùn)量相當(dāng)巨大,而影響我國航運(yùn)客運(yùn)量的因素有很多,例如第三產(chǎn)業(yè)增加值(億元),城市居民消費(fèi)水

4、平(絕對元),定期航班航線里程(萬千里)等1。為了研究過去的情況,從中國統(tǒng)計(jì)年鑒2得到1994年統(tǒng)計(jì)摘要,分析類似因素對我國航空客運(yùn)量的影響。二、數(shù)據(jù)描述如下為所得統(tǒng)計(jì)數(shù)據(jù):表1 1978-1993年統(tǒng)計(jì)數(shù)據(jù)年份y民航客運(yùn)量(萬人)x1國民收入(億元)x2消費(fèi)額(億元)x3鐵路客運(yùn)量(萬人)x4民航航線里程(萬公里)x5來華旅游入境人數(shù)(萬人)1978231301018888149114.89180.921979298335021958638916420.391980343368825319220419.53570.251981401394127999530021.82776.71198244

5、5425830549992223.27792.4319833914736335810604422.91947.719845545652390511035326.021285.2219857447020487911211027.721783.319869977859555210857932.432281.95198713109313638611242938.912690.231988144211738803812264537.383169.481989128313176900511380747.192450.14199016601438496639571250.682746.2199121781

6、6557109699508155.913335.651992288620223129859969383.663311.519933383248821594910545896.084152.7三、模型建立:(1)提出假設(shè)條件,明確概念,引進(jìn)參數(shù);參考相關(guān)書籍3,設(shè)隨機(jī)變量民航客運(yùn)量為(萬人),解釋變量,分別為國民收入(億元),消費(fèi)額(億元),鐵路客運(yùn)量(萬人),民航航線里程(萬公里),來華旅游入境人數(shù)(萬人),且回歸函數(shù),稱,為多元線性回歸模型,為回歸系數(shù),為隨機(jī)誤差。為上述來自多元線性回歸模型的樣本值,滿足:為了便于對模型進(jìn)行參數(shù)估計(jì)、模型檢驗(yàn)、變量選擇等,有必要對模型作如下一些基本假定。1.

7、 解釋變量,是可控制的、非隨機(jī)變量,互不相關(guān)。2. 隨機(jī)誤差項(xiàng)具有零均值和同方差的性質(zhì),即,并且,則有。3. 隨機(jī)變量誤差項(xiàng)服從正態(tài)分布,即(2)模型構(gòu)建:由表1通過excel繪制變量對因變量的關(guān)系散點(diǎn)圖如下:圖1 民航客運(yùn)量與國民收入關(guān)系圖圖2 民航客運(yùn)量與消費(fèi)額關(guān)系圖圖3 民航客運(yùn)量與鐵路客運(yùn)量關(guān)系圖圖4 民航客運(yùn)量與民航航線里程關(guān)系圖圖5 民航客運(yùn)量與來華旅游入境人數(shù)關(guān)系圖由以上的散點(diǎn)圖看出:與存在非線性關(guān)系,但與其它幾個(gè)變量基本是線性相關(guān)的。所以首先考慮回歸模型為多元線性模型。四、模型求解。采用最小二乘估計(jì)法求解模型參數(shù),采用spss軟件計(jì)算,得到如下結(jié)果:表2 擬合過程小結(jié)表3 方差

8、分析表4 回歸過程統(tǒng)計(jì)量圖6 殘差圖則回歸方程為五、模型分析檢驗(yàn)(1)決定系數(shù)由決定系數(shù)=0.998看出回歸方程高度顯著。(2)方差分析表(3)回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn)):回歸系數(shù)的顯著性檢驗(yàn)由顯著性一列看出自變量的回歸系數(shù)都通過了t檢驗(yàn)(即收尾概率小于規(guī)定的顯著性水平0.05),說明5個(gè)自變量對的影響顯著。其中鐵路客運(yùn)量的顯著性為0.006最大,但仍小于5%。(4)檢驗(yàn)殘差序列的自相關(guān)性(d-w檢驗(yàn)):d-w=1.9932,所以認(rèn)為模型不存在序列的自相關(guān)性。(6)異方差檢驗(yàn)從殘差圖看出所有點(diǎn)落在2之間,沒有明顯變化趨勢,所以認(rèn)為綜上,認(rèn)為用最小二乘估計(jì)的方法估計(jì)的模型理論上是有效的。(7

9、) 模型進(jìn)一步分析雖然,模型通過了檢驗(yàn),但是由之前的圖可知與正相關(guān),但(國民消費(fèi)額)的回歸系數(shù)是負(fù)值,顯然是矛盾的,同時(shí)和的vif很大,的vif也大于10,其原因是自變量之間的共線性,因而回歸模型還要就共線性問題進(jìn)行談?wù)?。如下表是各變量之間的相關(guān)系數(shù):表5 相關(guān)系數(shù)表可以看出,與,的相關(guān)系數(shù)都在0.9以上,說明所選自變量與高度線性相關(guān),驗(yàn)證之前的散點(diǎn)圖。用與自變量作多元線性回歸是適合的。另一方面,與各變量的相關(guān)系數(shù)均小于0.5,而,之間的相關(guān)系數(shù)均達(dá)到0.9以上,所以應(yīng)嘗試解決它們之間的共線性。首先剔除vif最大的,計(jì)算剩余變量參與的回歸方程。結(jié)果如下:表6 統(tǒng)計(jì)量表可以看出,當(dāng)前的vif最大

10、,同時(shí)也沒通過t檢驗(yàn),其顯著性0.233遠(yuǎn)大于0.05,故繼續(xù)剔除。計(jì)算剩余參數(shù)的回歸方程,結(jié)果如下:表7 統(tǒng)計(jì)量表表8 擬合過程小結(jié)表9 方差分析表可以看出三個(gè)變量的vif均小于10,且均通過了t檢驗(yàn)。說明此回歸模型不存在強(qiáng)多重共線性,回歸系數(shù)也有合理的經(jīng)濟(jì)解釋。說明回歸方程高度顯著,方差分析的結(jié)果也說明回歸方程顯著性高。圖7 殘差直方圖圖8 殘差正態(tài)p-p圖由p-p圖和直方圖可知?dú)埐罘恼龖B(tài)分布,所以模型是有效的4。所以民航客運(yùn)量的回歸模型為:。六、嶺回歸模型除了上述方法,在處理自變量之間存在強(qiáng)線性相關(guān)的情況時(shí),可以采用嶺回歸進(jìn)行估計(jì)(雖然犧牲了一定的無偏性)5。采用spss編寫程序運(yùn)行可

11、得到如下嶺回歸結(jié)果。表10 k值表圖9 嶺跡圖由上述結(jié)果,可知rsq均大于0.98,取k=0.85,再進(jìn)行嶺回歸,得嶺回歸模型:表11 嶺回歸統(tǒng)計(jì)表可以看出除了的回歸系數(shù)為負(fù),其余均為正,同時(shí)各變量的顯著性檢驗(yàn)均通過。方差分析顯示回歸模型高度顯著。所以該方法所得的回歸模型為:七、主要的結(jié)論或發(fā)現(xiàn)。比較兩種方法的得到的回歸模型:可以看出兩種模型均認(rèn)為,對的正面貢獻(xiàn)度度小于,或者認(rèn)為可以忽略。這說明國民收入和消費(fèi)額對于民航客運(yùn)量的影響很小。查閱相關(guān)歷史可知,我國民航的發(fā)展有多個(gè)階段。第一階段是50到70年代末,主要是軍隊(duì)管民航,經(jīng)營上采取高度集中的計(jì)劃經(jīng)濟(jì)體制,航空運(yùn)輸規(guī)模較小且發(fā)展緩慢。第二階段

12、是從1980-1992年,民航實(shí)施企業(yè)化改革,成立了新的地區(qū)管理局、國家骨干航空公司和一些區(qū)域性的航空公司。這個(gè)階段正是數(shù)據(jù)來源時(shí)期。在該時(shí)期,民航的發(fā)展仍處于起步階段,同時(shí)該時(shí)期即使是經(jīng)濟(jì)相對發(fā)達(dá)的沿海地區(qū)也尚未達(dá)到小康階段,出行乘坐飛機(jī)仍是絕大多數(shù)人所不能承受的。所以來自國內(nèi)的客運(yùn)量是相當(dāng)小的。這也解釋了為什么游客數(shù)量的回歸系數(shù)大于,(事實(shí)上,兩者的線性相關(guān)程度很高,國民收入提高,消費(fèi)自然上升),而是與y的關(guān)系最直接的,航線里程數(shù)的增加,自然反映客運(yùn)量的增加,所以該自變量的系數(shù)是最大的。的系數(shù)為負(fù),很顯然兩種交通方式是競爭關(guān)系,但是正如前面所分析,人們出遠(yuǎn)門乘飛機(jī)很少,無論乘火車的人數(shù)如何

13、增加,對飛機(jī)的客運(yùn)量產(chǎn)生的影響很小,所以的系數(shù)依舊很小。為了體現(xiàn)所有變量對y的影響,最終決定使用 作為回歸模型。參考資料1 彭立南,影響民航客運(yùn)量因素的相關(guān)性分析及實(shí)證研究,中國市場,2014 ,35 (798 ):160-1612 中國統(tǒng)計(jì)年鑒,197819933 楊虎、劉瓊蓀、鐘波,數(shù)理統(tǒng)計(jì),高等教育出版社,2004,103-1184 盧文岱、朱紅兵,spss統(tǒng)計(jì)分析(第五版),電子工業(yè)出版社,2015,270-3005 何曉群、劉文卿,應(yīng)用回歸分析(第三版),中國人民大學(xué)出版社,2011,169-189附錄spss 嶺回歸代碼include c:program files (x86)sp

14、ssincpaswstatistics18samplesenglishridge regression.sps.ridgereg dep=y /enter x1 x2 x3 x4 x5/start=0.0 /stop=0.2/inc=0.02.include c:program files (x86)spssincpaswstatistics18samplesenglishridge regression.sps.ridgereg dep=y /enter x1 x2 x3 x4 x5/k=0.085.sps文件修改代碼*-.* calculate raw coefficients from

15、standardized ones, compute standard errors* of coefficients, and an intercept term with standard error. then print* out similar to regression output.*-(從這里開始是給出系數(shù)估計(jì)). compute beta=b;0. compute b= ( b &/ std ) * sy. compute intercpt=ybar-t(b)*t(xmean). compute b=b;intercpt. compute xpx=(sse/(sst*(n-n

16、v-1)*inv(xpx+(k &* ident(nv,nv)*xpx* inv(xpx+(k &* ident(nv,nv). compute xpx=(sy*sy)*(mdiag(1 &/ std)*xpx*mdiag(1 &/ std). compute seb=sqrt(diag(xpx). compute seb0=sqrt( (sse)/(n*(n-nv-1) + xmean*xpx*t(xmean). compute seb=seb;seb0. compute rnms=varname,constant. compute ratio=b &/ pute ppp=2*(1-tcdf(abs(ratio),n-nv-1). compute bvec=b,seb,beta,ratio,ppp

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論