北航數(shù)理統(tǒng)計大作業(yè)1-線性回歸分析_第1頁
北航數(shù)理統(tǒng)計大作業(yè)1-線性回歸分析_第2頁
北航數(shù)理統(tǒng)計大作業(yè)1-線性回歸分析_第3頁
北航數(shù)理統(tǒng)計大作業(yè)1-線性回歸分析_第4頁
北航數(shù)理統(tǒng)計大作業(yè)1-線性回歸分析_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

應(yīng)用數(shù)理統(tǒng)計作業(yè)一二〇一四年十二月國內(nèi)生產(chǎn)總值的多元線性回歸模型摘要:本文首先選取了選取我國自1978至2012年間的國內(nèi)生產(chǎn)總值為因變量, 11介紹 22統(tǒng)計分析步驟 32.1數(shù)據(jù)的采集和整理 2.2采用多重逐步回歸分析 62.3進行共線性診斷 2.4進行主成分分析確定所需主成份 2.5進行主成分逐步回歸分析 3結(jié)論 參考文獻 北京航空航天大學數(shù)理統(tǒng)計課程論文第1頁0符號說明變量符號國內(nèi)生產(chǎn)總值Y交通運輸增加量X?住宿和餐飲業(yè)增加值X?房地產(chǎn)業(yè)X?人口國民總收入Xs工業(yè)生產(chǎn)總值X?建筑業(yè)生產(chǎn)總值X?北京航空航天大學數(shù)理統(tǒng)計課程論文第2頁國內(nèi)生產(chǎn)總值是指在一定時期內(nèi)(一個季度或一年),一個國家或地區(qū)的經(jīng)它不但可反映一個國家的經(jīng)濟表現(xiàn),還可以反映一國的國力與財富。2012年1月,國家統(tǒng)計局公布2011年重要經(jīng)濟數(shù)據(jù),其中GDP增長9.2%,基本符合預(yù)期。2012年10月18日,統(tǒng)計顯示,2012年前三季度國內(nèi)生產(chǎn)總值353480億元,同比增長7.7%;其中,一季度增長8.1%,二季度增長7.6%,三季度增長7.4%,三季度增幅創(chuàng)下2009年二季度以來14個季度新低。中國的GDP核算歷史不長,上世紀90年代之前通常用“社會總產(chǎn)值”來衡上世紀80年代初中國開始研究聯(lián)合國國民經(jīng)濟核算體系的國內(nèi)生產(chǎn)總值2003年國家統(tǒng)計局宣布中國將改進GDP核算與數(shù)據(jù)發(fā)布制度,取消容易引2014年將全力推進重點改革創(chuàng)新積極穩(wěn)妥的推進國家統(tǒng)一核算地區(qū)生產(chǎn)總2005年12月20日,中國國家統(tǒng)計局根據(jù)一項重大的經(jīng)濟統(tǒng)計計劃所獲得的數(shù)據(jù)重新發(fā)布了中國2004年國內(nèi)生產(chǎn)總值為15.98萬億元人民幣,比預(yù)期增加預(yù)期16.8%。此統(tǒng)計過程世界銀行向中國政府提供了咨詢。根據(jù)這項統(tǒng)計,中北京航空航天大學數(shù)理統(tǒng)計課程論文第3頁國農(nóng)業(yè)的比例占13.1%,工業(yè)比例占46.2%,服務(wù)業(yè)比例上升到40.7%。造成中國2004年經(jīng)濟數(shù)據(jù)大幅度增長的原因是由于本次第一次全國經(jīng)濟普查(全國經(jīng)濟普查)中發(fā)現(xiàn)漏報的第三產(chǎn)業(yè)經(jīng)濟總值高達2.4萬億元人民幣。國民生產(chǎn)總值是指一個國家(地區(qū))所有常住機構(gòu)單位在一定時期內(nèi)(年或季)收入初次分配的最終成果(簡稱GNP)。一個國家常住機構(gòu)單位從事生產(chǎn)活動所創(chuàng)造的增加值(國內(nèi)生產(chǎn)總值)在初次分配過程中主要分配給這個國家的常國內(nèi)生產(chǎn)總值加上來自國外的勞動報酬和財產(chǎn)收入減去支付給國外的勞動者報國內(nèi)生產(chǎn)總值是反映一國(地區(qū))全部生產(chǎn)活動最終成果的重要指標,是一個國家(地區(qū))領(lǐng)土范圍內(nèi),包括本國居民、外國居民在內(nèi)的常住單位在報告期本文在進行統(tǒng)計時,查閱《中國統(tǒng)計年鑒》中收錄的1978年至2012年連續(xù)35年的國內(nèi)生產(chǎn)總值為因變量,考慮一些與國內(nèi)生產(chǎn)總值關(guān)系密切并且直觀上有線性關(guān)系的因素,經(jīng)過深思熟慮我初步選取了這35年的交通運輸增加量、住表2-錯誤!未找到引用源。1978-2012年國內(nèi)生產(chǎn)總值及其影響因素統(tǒng)計表年度通運輸增加值宿和餐飲業(yè)增加值地產(chǎn)業(yè)民總收內(nèi)生產(chǎn)總值業(yè)生產(chǎn)總值筑業(yè)生產(chǎn)總值北京航空航天大學數(shù)理統(tǒng)計課程論文第4頁北京航空航天大學數(shù)理統(tǒng)計課程論文第5頁480.7447.6402.3479.28068.29655.29095.70332.7431.34977.09453.69878.34937.4北京航空航天大學數(shù)理統(tǒng)計課程論文第6頁2.2采用多重逐步回歸分析解:擬合國民生產(chǎn)總值與這7個因素的線性回歸曲線,,我們不知道他們對北京航空航天大學數(shù)理統(tǒng)計課程論文第7頁散點圖由圖一可見,有兩觀察點學生化殘差的絕對值大于2,懷疑其為異常點。不考慮該異常點重新擬合回歸模型。將自變量xj,x?,x?,x?,x?,x?,x?錯誤!未找到引用源。作為待篩選量,使用專業(yè)統(tǒng)計分析軟件IBMSPSSStatistics20進行逐步回歸計算,a。=0.05,α=0.1錯誤!未找到引用源。。有兩個變量沒有達到選入標準,最終沒有進入。其分析結(jié)果如表2-1至2-6所示。輸入╱移去的變量模型輸入的變量移去的變量方法12國民總收入建筑業(yè)生產(chǎn)總值步進(準則:F-to-enter的概率<=.050,F-to-remove的概率>=.100)步進(準則:F-to-enter的概率<=.050,F-to-remove的概率>=.100)(北京航空航天大學數(shù)理統(tǒng)計課程論文第8頁345交通運輸增加值房地產(chǎn)業(yè)工業(yè)生產(chǎn)總值步進(準則:F-to-enter的概率<=.050,F-to-remove的概率>=.100)。步進(準則:F-to-enter的概率<=.050,F-to-remove的概率>=.100)。步進(準則:F-to-enter的概率<=.050,F-to-remove的概率>=.100)。表2-2型RR方調(diào)方標準估計的誤差更改統(tǒng)計量Durbin-Wa方更改dd改111l111111484218161658.32722.649113332313029北京航空航天大學數(shù)理統(tǒng)計課程論文第9頁b.預(yù)測變量:(常量),國民總收入,建筑業(yè)生產(chǎn)總值。c.預(yù)測變量:(常量),國民總收入,建筑業(yè)生產(chǎn)總值,交通運輸增加值。d.預(yù)測變量:(常量),國民總收入,建筑業(yè)生產(chǎn)總值,交通運輸增加值,房地產(chǎn)業(yè)。e.預(yù)測變量:(常量),國民總收入,建筑業(yè)生產(chǎn)總值,交通運輸增加值,房地產(chǎn)業(yè),工業(yè)生產(chǎn)總f.因變量:國內(nèi)生產(chǎn)總值表2-3擬合的模型的決定系數(shù)的改變情況表2-4模型平方和均方F總殘總歸差歸68593645578427734463.52768596419024768594218251422007733.008685964190247685951473427685964190247123685936455784840438.289342971091257687741.656228650491142410220.009816165.166498691.751557385.028計回23差計歸差計23殘總回殘總北京航空航天大學數(shù)理統(tǒng)計課程論文第10頁殘總殘總差計4計差計回歸殘5總6859539844136859641902476859560198018170445.90968596419024745340194.464281739.514504089.61486943.42b.預(yù)測變量:(常量),國民總收入。表2-4對擬合后的模型的方差分析檢驗結(jié)果表2-5模型Bett偏相關(guān)共線性統(tǒng)計量容差VIF最小容差交通運輸增加值住宿和餐飲業(yè)增加值89797值值值值北京航空航天大學數(shù)理統(tǒng)計課程論文第11頁房地產(chǎn)業(yè)人口工業(yè)生產(chǎn)總值建筑業(yè)生產(chǎn)總交通運輸增加住宿和餐飲業(yè)增加值2房地產(chǎn)業(yè)人口工業(yè)生產(chǎn)總值住宿和餐飲業(yè)增加值房地產(chǎn)業(yè)3人口工業(yè)生產(chǎn)總值住宿和餐飲業(yè)4增加值-.006°-.04°7467-.0-.0-.00-.024°-1.3-1.4.70-1.-2.-1.-1.2770293981484-.l9-.2400195-.3-.4-.16-.190709650163025.52.567891.63.862032936.20699071240100北京航空航天大學數(shù)理統(tǒng)計課程論文第12頁人口工業(yè)生產(chǎn)總值住宿和餐飲業(yè)增加值5人口138202750140000b.模型中的預(yù)測變量:(常量),國民總收入。生產(chǎn)總值。表2-5多重線性回歸擬合模型過程中未進入模型的變量的檢驗情況表2-6給出了殘差、預(yù)測值等一些指標。表2-6極小值極大值均值標準偏差N預(yù)測值標準預(yù)測值預(yù)測值的標準誤差調(diào)整的預(yù)測值34北京航空航天大學數(shù)理統(tǒng)計課程論文第13頁殘差標準殘差Student化殘差已刪除的殘差Student化已刪除的殘差Mahal。距離Cook的距離居中杠桿值87圖2所示為殘差的直方圖??梢?,殘差分布比較均勻,近似正態(tài)分布,反應(yīng)了變量服從正態(tài)分布。直方圖因變量:國內(nèi)生產(chǎn)總值因變量:國內(nèi)生產(chǎn)總值標準偏差.=0.924N=35回歸標準化殘差頻率如圖3所示為殘差的正態(tài)P-P圖,可見殘差分布是否正態(tài),可見散點大部分呈期望的累積概率期望的累積概率北京航空航天大學數(shù)理統(tǒng)計課程論文第14頁國內(nèi)生產(chǎn)總值的指數(shù)P-P圖表2-7即為共線性診斷表格表2-7相特征值條件索引方差比例(常量)國民總收入建筑業(yè)生產(chǎn)總值交通運輸增加值房地產(chǎn)業(yè)工業(yè)生產(chǎn)總值129150032500324352北京航空航天大學數(shù)理統(tǒng)計課程論文第15頁1470206445065北京航空航天大學數(shù)理統(tǒng)計課程論文第16頁56-00506343.l0表2-8系數(shù)模型非標準化系數(shù)標準系數(shù)t共線性統(tǒng)計量B標準誤差試用版容差VIF(常量)1國民總收入(常量)國民總收2入建筑業(yè)生產(chǎn)總值(常量)國民總收3入建筑業(yè)生產(chǎn)總值92.634-978.016-3.0000北京航空航天大學數(shù)理統(tǒng)計課程論文第17頁交通運輸增加值(常量)國民總收入建筑業(yè)生4產(chǎn)總值交通運輸增加值房地產(chǎn)業(yè)(常量)國民總收入建筑業(yè)生產(chǎn)總值5交通運輸增加值房地產(chǎn)業(yè)工業(yè)生產(chǎn)總值6669176195930428特征值:實際上是對自變量進行主成份分析,如果特征根為0,則提示有嚴值,由表可看出第4個模型的第5個因子特征根為0,且VIF值除了模型一的國民北京航空航天大學數(shù)理統(tǒng)計課程論文第18頁表2-9均值標準差交通運輸增加值住宿和餐飲業(yè)增加值房地產(chǎn)業(yè)人口國民總收入工業(yè)生產(chǎn)總值建筑業(yè)生產(chǎn)總值45707.1406958.178619.206856587.71419409.2998交通運輸增加值住宿和餐飲業(yè)增加值房人口國民總收入工業(yè)生產(chǎn)總值建筑業(yè)生產(chǎn)總值交通運輸增加值住宿和餐飲業(yè)增加值相關(guān)房地產(chǎn)業(yè)人口國民總收入010北京航空航天大學數(shù)理統(tǒng)計課程論文第19頁工業(yè)生產(chǎn)總值建筑業(yè)生產(chǎn)總值交通運輸增加值住宿和餐飲業(yè)增加值房地產(chǎn)業(yè)人口(單側(cè))國民總收入工業(yè)生產(chǎn)總值建筑業(yè)生產(chǎn)總值960000000通過SPSS操作得到如下主成份分析結(jié)果。各主成份的的貢獻率及累積貢獻率。第一主成分的特征根為6.641,它解釋了總值的94.87%;第一主成分的特征根為0.333,它解釋了總值的4.756%。前兩個特征根的累積貢獻率為99.625%,即前兩個主成份包含了原有7個指標的99.625%的信息,所以本題可以取前兩個主成份來代替原有的7個指標變量。特特征值北京航空航天大學數(shù)理統(tǒng)計課程論文第20頁表2-11成份初始特征值提取平方和載入合計方差的%合計方差的%234567(2)碎石圖,顯示前兩個主成份的特征根接近1及以上,進一步說明取前兩成分數(shù)圖4(3)成分得分系數(shù)矩陣,如下表,通過該矩陣可以將所有主成份表示為各個變量的線性組合。北京航空航天大學數(shù)理統(tǒng)計課程論文第21頁表2-12成份1234567交通運輸增加值住宿和餐飲業(yè)增加值房地產(chǎn)業(yè)人口國民總收入工業(yè)生產(chǎn)總值建筑業(yè)生產(chǎn)總值0073811643542769提取方法:主成份。由表可得公式(1):z?=0.150stdx+0.15Ostdx?+0.150stdx?+0.13Ostdx?+0.149stdx?+0.149stdx?+0.147stdxz?=0.070stdx?+0.040stdx,+0.070stdx?+1.491stdx?-0.460stdx?-0.420stdx,-0.617stdx,北京航空航天大學數(shù)理統(tǒng)計課程論文第22頁stdx?=(x?-711.746)/619.2068stdx?=(x?-11880614)/12403620stdx?=(x?-113027620)/1414575013由上述前兩個主成份包含了原有7個指標的99.625%的信息,所以本題可以取前兩個主成份來代替原有的7個變量進行主成份回歸分析。運用SPSS得到如(1)由表2-13可見主成份回歸分析的模型擬合情況,結(jié)果顯示模型2擬合較好((R2=0.999方差分析P<0.00D表2-13型RR方方標準估計的誤差更改統(tǒng)計量方更改改dd改113332a.預(yù)測變量:(常量),REGRfactorscoreb.預(yù)測變量:(常量),REGRfactorscore北京航空航天大學數(shù)理統(tǒng)計課程論文第23頁表2-14主成份回歸分析的模型擬合效果及假設(shè)檢驗。表2-14模型平方和均方F總計殘差總計殘差回歸殘差回歸2總計669231682385685964190247685220406193743784054.20268596419024712669231682385507045692.78734261020309623243251.694b.預(yù)測變量:(常量),REGRfactorscore(2)表2-15是主成份分析的參數(shù)估計及其假設(shè)檢驗結(jié)果:表2-15模型非標準化系數(shù)標準系數(shù)t共線性統(tǒng)計量B標準誤差試用版容差VIF|2(常量)analysis1(常量)analysis1analysis]-2168588(P=0.000,0.000,0.000),即z?(fac1-1)p=113583545+140297130z?-21685400z,(3)將主成份分析結(jié)果(見表2-12)引入。將公式(1)的z?與z,表達式≥=113583545+1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論