




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、論文題目:基于MATLAB的國內(nèi)旅游業(yè)發(fā)展預(yù)測2基于MATLAB的國內(nèi)旅游業(yè)發(fā)展預(yù)測摘要本文主要對國內(nèi)旅游業(yè)市場收入以及發(fā)展進行預(yù)測和研究,從問題一二的特點出發(fā),分別用一元多項式回歸分析、指數(shù)模型、多元線性回歸、多元非線性回歸、灰色理論GM(1,N)以及BP神經(jīng)網(wǎng)絡(luò),預(yù)測和分析國內(nèi)旅游業(yè)的市場收入和發(fā)展。針對問題一,根據(jù)相關(guān)數(shù)據(jù),首先從簡到難分別采取一元多項式回歸、指數(shù)曲線對往年數(shù)據(jù)進行擬合,并對未來5年的旅游人數(shù)進行預(yù)測。為了改進時間模型只考慮了時間這一單一變量的不足以及更好的反映和規(guī)劃出旅游市場的發(fā)展,為此我們引入多元回歸的分析,通過分析國內(nèi)旅游人數(shù),城鎮(zhèn)居民人均旅游支出,農(nóng)村居民人均旅游
2、支出,公路里程,鐵路里程相關(guān)變量對國內(nèi)旅游收入的影響,建立多元非線性回歸模型和多元線性回歸模型,并改進,最后進行統(tǒng)計意義檢驗和經(jīng)濟意義檢驗。通過分析,得出農(nóng)村居民人均旅游支出對國內(nèi)旅游業(yè)市場收入具有顯著影響,且國內(nèi)旅游市場收入在未來幾年仍將持續(xù)增長,并有蓬勃發(fā)展的趨勢。針對問題二,在問題一的基礎(chǔ)上以及分析相關(guān)度后,引入新的影響因素旅行社數(shù)量和星級酒店數(shù)量,進一步完善對國內(nèi)旅游業(yè)市場的分析和預(yù)測,并再次建立多元線性回歸模型,對以上影響因素進行參數(shù)檢驗和估計。同時選擇合適的影響因素建立灰色理論GM(1,N)模型,然后引進BP神經(jīng)網(wǎng)絡(luò)模型,由誤差分析的結(jié)果可知,BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果是比較可信的
3、。最后通過比較這些模型的MAPE(絕對平均誤差),并對優(yōu)缺點給出了客觀的評價,進一步從預(yù)測和決策的的角度分析和選取對國內(nèi)旅游收入這一問題適合的模型,并推廣到其他領(lǐng)域。本文的亮點是基于Matlab建立多種模型進行分析和預(yù)測,并進行統(tǒng)計意義檢驗和經(jīng)濟意義檢驗,最后用平均相對誤差,來衡量各個模型的預(yù)測精度。關(guān)鍵字:旅游收入 Matlab 多元回歸分析 灰色理論GM(1,N) BP神經(jīng)網(wǎng)絡(luò) 一、 問題提出1.問題背景:改革開放以來,我國的旅游業(yè)呈現(xiàn)蓬勃的發(fā)展趨勢,旅游業(yè)已成為中國社會新的經(jīng)濟增長點,在我國的經(jīng)濟建設(shè)中發(fā)揮了巨大的作用。隨著經(jīng)濟的發(fā)展和人民生活水平的進一步提高,相關(guān)旅游基礎(chǔ)設(shè)施建設(shè)的完善
4、,大眾旅游時代已經(jīng)悄然而至。農(nóng)村居民也正在成為整個旅游人群的主要組成部分,我們正迎來“大眾旅游”的時代。因此對旅游也經(jīng)濟收入的合理分析和正確預(yù)測,對促進旅游業(yè)的發(fā)展和規(guī)劃有著十分重要的意義。2.需解決的問題:(1)以國內(nèi)旅游業(yè)為研究對象,收集近21年的相關(guān)數(shù)據(jù),建立我國國內(nèi)旅游收入的回歸模型,并預(yù)測未來5年內(nèi)國內(nèi)旅游收入的情況。 (2)考慮其他國內(nèi)旅游市場收入的影響因素,建立多種定量預(yù)測模型。結(jié)合若干性能評價指標(biāo)對這些模型進行對比分析,比較各模型的預(yù)測效果。二、 模型假設(shè)1. 假設(shè)統(tǒng)計的數(shù)據(jù)真實可信; 2. 假設(shè)所建立的模型中,個別偏差太大的數(shù)據(jù)可據(jù)題適當(dāng)調(diào)整;3. 國內(nèi)旅游的變化主要受本文所
5、研究的若干個因素影響; 4. 旅游業(yè)發(fā)展相對平穩(wěn);5. 社會相對穩(wěn)定,國家的旅游政策短時間內(nèi)沒有重大變化三、 符號說明第i年的旅游人口數(shù),1994年為第一年國內(nèi)旅游市場收入旅游人數(shù)城鎮(zhèn)居民人均支出農(nóng)村居民人均支出公路里程鐵路里程旅游收入回歸方程系數(shù)四、 問題一的模型與求解4.1 數(shù)據(jù)的處理和擬合首先,對給定的1994-2014年的原始數(shù)據(jù)(見附件1),進行初步處理,利用MATLAB編程(程序見附錄2),畫出時間與各個因素的散點圖并進行擬合,以及殘差分析。其中國內(nèi)旅游人數(shù)的時間序列擬合(如Error! Reference source not found.Error! Reference sou
6、rce not found.),城鎮(zhèn)居民人均旅游支出的時間序列擬合(如圖 2圖 2 城鎮(zhèn)居民人均旅游支出的時間序列擬合),農(nóng)村居民人均旅游支出的時間序列擬合(如圖 3),公路里程的時間序列擬合(如圖 4),鐵路里程的時間序列擬合(如圖 5)。圖 1 國內(nèi)旅游人數(shù)的時間序列擬合圖 2 城鎮(zhèn)居民人均旅游支出的時間序列擬合圖 3農(nóng)村居民人均旅游支出的時間序列擬合圖 4 公路里程的時間序列擬合圖 5鐵路里程的時間序列擬合為了更好的反映個因素和時間的關(guān)系,通過擬合曲線,建立各影響因素與時間序列的一元多項式回歸模型: 通過Matlab求解得到,該模型一元三次多項式,其中為了更好的擬合x4建立一元二次多項式
7、,分別為:最后,將2015年到2019年的時間的序號t中22、23、24、25、26依次分別代入以上各影響因素與時間序列的一元多項式回歸模型中利用Matlab進行求解,得到未來五年的各個因素的值。見表 1表 1 各影響因素2015-2019年預(yù)測值年份20152016201720182019旅游人數(shù)4130.24637.75193.45799.56458.2城鎮(zhèn)居民人均支出1015.51058.31106.61161.11222.3農(nóng)村居民人均支出695.9811.9945.91099.31273.5公路里程509.0535.9563.4591.5620.2鐵路里程11.912.713.714
8、.816.14.2 一元多項式回歸在建立旅游市場的預(yù)測模型中,運用回歸分析的方法建立回歸模型是較為常用的一種方法。回歸分析模型主要有線性回歸模型和非線性回歸模型兩大類,在線性模型中叉可分為一元線性回歸模型、多元線性回歸模型和多項式回歸模型。簡單的回歸分析模型,即一元線性回歸模型,是趨勢外推模型中最為簡單和實用的一種模型,在對旅游收入建立較復(fù)雜的多元回歸模型之前,先用簡單回歸分析法對旅游收入的模型預(yù)測進行探討。根據(jù)相關(guān)數(shù)據(jù),繪制出國內(nèi)旅游收入隨時間的散點圖進行擬合。(如圖 6)建立一元多項式回歸模型: 利用Matlab自帶的擬合工具箱進行多項式擬合,綜合預(yù)測精度高、分析方便,等因素考慮,通過Ma
9、tlab求解得到,該模型一元三次多項式為:圖 6 國內(nèi)旅游收入時間序列擬合繪制殘差圖(如圖 7),得到殘差模 = 1.8365e-11并且由殘差圖可以很明確的看出,一元三次多項式很好的擬合了原來的數(shù)據(jù)。圖 7 一元三次多項式擬合殘差圖由該模型預(yù)測的2015-2019年的旅游收入如表 2:表 2 一元多項式回歸模型預(yù)測未來5年旅游市場收入年份/年20152016201720182019收入/億元37240.944080.851792.460428.870043.44.3 指數(shù)模型 根據(jù)國內(nèi)旅游收入時間序列的散點圖,大致看出它的發(fā)展趨勢,符合指數(shù)曲線的模型,因此建立指數(shù)模型,來擬合數(shù)據(jù),然后根據(jù)這
10、個模型來預(yù)測未來五年的旅游收入情況。1994-2014 年國內(nèi)旅游市場收入的散點圖如圖 8圖 8 國內(nèi)旅游市場收入1994-2014年散點圖由matlab計算得到回歸方程:由該模型預(yù)測的2015-2019年的旅游收入如表 3 表 3 指數(shù)模型預(yù)測2015-2019年國內(nèi)旅游市場收入值年份/年20152016201720182019收入/億元3.89334.79925.92227.31409.0392綜合以上分析,對旅游市場收入的預(yù)測模型研究都是基于一個自變量,即時間序號來進行的,因此都是一元回歸模型。通常這些回歸模型都具有較好的擬合度,都能用于旅游收入的短期預(yù)測,而且通過模型還可以進行診斷分析
11、、異常點檢驗、強影響點檢驗等多種更高級的統(tǒng)計分析,和指數(shù)模型相同,都可以較好的解決問題,但是隨著時間的序列的遞增,其預(yù)測值一直上升,并且沒有考慮其他因素的影響,為此我們引入多個變量,建立多元非線線性規(guī)劃。4.4 非線性線性回歸模型由于旅游業(yè)的綜合性和易波動性等特征,影響旅游市場收入的因素往往有很多,綜合前面的分析我們針對國內(nèi)旅游市場收入建立多元非線性回歸模型:利用Matlab(程序見附件1.2)進行求解得到該多元非線性回歸模型:從模型可以看出充分的考慮了,各因素對國內(nèi)旅游市場收入的影響,并結(jié)合各因素未來5年的擬合值,分析并結(jié)合各因素擬合值,預(yù)測未來5年的收入。表 4 多元非線性回歸模型年份/年
12、20152016201720182019收入/億元41510.6652772.0967052.9185052.61107611.07在matlab通過逐步回歸分析對5個變量進行引入和移除的動態(tài)分析,逐步回歸分析如圖 9所示:圖 9 逐步回歸分析通過逐步分析,可以看出相關(guān)系數(shù)R2=0.996,從擬合優(yōu)度的角度看,在多元非線性回歸中用R2作為修正的可決系數(shù)反映模型解釋實際問題的能力有多大,其值越接近 1,表明模型的擬合程度就越高。在上述模型中R2=0.996,說明模型的擬合優(yōu)度非常好。且顯著性水平為F=859.51,誤差RMSE=594.51,在進行綜合考慮后,決定保留這5個因素。4.5 多元線性
13、回歸模型在考慮多因素的情況下,為了使模型簡化,并且利于分析和決策,將非線性模型進行線性分析,并建立旅游收入的多元線性回歸模型。設(shè)影響因變量的自變量個數(shù)為個,多元線性模型是指這些自變量對的影響是線性的,即關(guān)系式()其中: 是個未知參數(shù),為常數(shù)項, 稱為回歸系數(shù); 是個可得到精確值并能夠控制的一般變量,稱為解釋變量,稱為對自變量 的線性回歸函數(shù),是隨機誤差,通常認(rèn)為。則,其中,這個模型稱為多元線性回歸模型。,則上述模型的矩陣形式為:。綜上,記為國內(nèi)旅游收入,國內(nèi)旅游人數(shù),城鎮(zhèn)居民人均旅游收入,農(nóng)村居民人均旅游收入,公路里程,鐵路里程。則建立出5元回歸模型,其中是隨機誤差服從正態(tài)分布N(0,),(i
14、=0,15)為回歸系數(shù)。通過Matlab進行求解(程序見附件1.3),得到多元線性回歸方程如下:由方程可知,國內(nèi)旅游人數(shù),農(nóng)村居民人均旅游支出對國內(nèi)旅游收入的影響較大,其中旅游人數(shù)對旅游收入影響最大,同時可以看出,城鎮(zhèn)居民人均旅游支和鐵路里程對旅游收入的影響較小,而公路里程對旅游收入是負(fù)影響。利用MATLAB統(tǒng)計工具箱中命令regress求解,得到模型(1)的回歸系數(shù)估計值及其置信區(qū)間(置信水平=0.05)、檢驗統(tǒng)計量R2,F(xiàn),p的結(jié)果見表 5。表 5 多元線性回歸分析系數(shù)以及參數(shù)表回歸系數(shù)回歸系數(shù)估計值回歸系數(shù)置信區(qū)間-3219.63-10727,428810.348,13-3.09-9,3
15、7.821,15-18.18-26,-11221.50-1308,1751 R2=0.9965 F=859.5075 p=0 結(jié)果分析:stats=0.9965 859.5075 0.0000 353442bint為各系數(shù)的置信區(qū)間。stats矢量是值分別為相關(guān)系數(shù)的平方、F值和顯著性概率P。相關(guān)系數(shù)平方值R2=0.9965,說明模型擬合程度較高。顯著性概率P=0,小于005,故拒絕零假設(shè),認(rèn)為模型1中至少有一個自變量的系數(shù)不為零,因而從總體上模型1是有意義Et的。結(jié)果b給出了回歸系數(shù)的估計值,檢查它們的置信區(qū)間發(fā)現(xiàn),相應(yīng)系數(shù)的置信區(qū)間包含了零點,表明回歸變量x2 ,x5對變量y的影響不是太顯
16、著,因此從模型中移出次變量。 4.5.1 模型的改進在以上對b的個系數(shù)置信區(qū)間分析后,以下只研究一下三個因素的影響,即國內(nèi)旅游人數(shù),農(nóng)村居民旅游人均支出,公路里程,重新建立多元線性回歸模型:利用Matlab求解:改進后模型預(yù)測的2015-20195年的旅游收入如表 6:表 6 改進后的多元回歸分析預(yù)測值年份/年20152016201720182019收入/億元3.89334.79925.92227.31409.03924.5.2 統(tǒng)計意義檢驗利用MATLAB統(tǒng)計工具箱中命令regress求解,得到改進后的多元線性回歸模型的回歸系數(shù)估計值及其置信區(qū)間(置信水平=0.05)、檢驗統(tǒng)計量R2,F(xiàn),p
17、的結(jié)果見表 7。表 7多改進后模型的系數(shù)以及參數(shù)表回歸系數(shù)回歸系數(shù)估計值回歸系數(shù)置信區(qū)間-3255.32-4010,-250010.839,115.990.2,11.7-21.06-26,-15 R2=0.9962 F=1499.9137 p=0 由上表可知,相關(guān)系數(shù)平方值R2=0.9962,R2的值越接近,回歸直線對觀測值的擬合程度越好,說明模型的擬合程度依然較高,在相關(guān)系數(shù)平方值基本相等的情況下, F值由原來的859.5075增大到1499.9137。說明模型總體顯著性明顯增大。從顯著性檢驗的角度看,在顯著性水平為0.05 時,P 值均小于0.05,表明通過了t 檢驗,此模型順利通過了回歸
18、系數(shù)的顯著性檢驗。并且可以看出國內(nèi)旅游人數(shù)、農(nóng)村居民旅游人均支出的增加對國內(nèi)旅游收入情況具有顯著性影響,公路里程則對國內(nèi)旅游收入有相反的影響效果。4.5.3 經(jīng)濟意義檢驗根據(jù)多元線性回歸分析的結(jié)果,可得出以下結(jié)論:(1)參數(shù)x1,即國內(nèi)旅游人數(shù)的系數(shù)為正數(shù),說明x1 與國內(nèi)旅游業(yè)市場收入存在正相關(guān),即國內(nèi)旅游人數(shù)越多,我國的國內(nèi)旅游業(yè)市場收入也會隨之增加。(2)參數(shù)x3,農(nóng)村居民人均支出的系數(shù)為正數(shù),說明x3與國內(nèi)旅游業(yè)市場收入存在正相關(guān),即農(nóng)村居民人均支出越多,我國的國內(nèi)旅游業(yè)市場收入也會隨之增加。從另一個方面進一步說明,城鎮(zhèn)居民人均旅游支出相對穩(wěn)定平緩,而農(nóng)村居民旅游支出正在持續(xù)增長,發(fā)展
19、農(nóng)村旅游業(yè)經(jīng)濟建設(shè),更有利于國內(nèi)旅游業(yè)市場收入。(3)參數(shù)x4,即公路里程的系數(shù)為負(fù)數(shù),表明說明x4與國內(nèi)旅游業(yè)市場收入存在負(fù)相關(guān),進一步說明我國基礎(chǔ)設(shè)施建設(shè)趨于完善,并且選擇公路出行的可替代性高,對國內(nèi)旅游業(yè)市場收入的增長,沒有太大的推動作用,但是同時我們應(yīng)該認(rèn)識到,公路等基礎(chǔ)實施的建設(shè),間接的影響著國內(nèi)旅游經(jīng)濟的收入。4.6 關(guān)聯(lián)度檢驗為進一步準(zhǔn)確的了解各影響因素對國內(nèi)旅游市場收入的影響,我們采用關(guān)聯(lián)度檢驗進行分析。因分辨系數(shù)是在(0,1)中取定的實數(shù),一般取=0.5。關(guān)聯(lián)度是各關(guān)聯(lián)系數(shù)(k)累加后在n 維空間的平均值。當(dāng)分辨系數(shù)=0.5,認(rèn)為關(guān)聯(lián)度大于0.6 時可以接受,即通過關(guān)聯(lián)度檢驗
20、,否則關(guān)聯(lián)程度差些。設(shè)參考序列為 比較序列為 關(guān)聯(lián)系數(shù)定義為:式中, 為第k點x0與xj的絕對差; 為兩級最小差,其中是第一級最小差,表示在Xj序列上找各點與X0的最小差;為第二級最小差,表示在各序列中找出的最小差基礎(chǔ)上尋求所有序列中的最小差;是兩級最大差,其含義與最小差相似。 P稱為分辨率, 0P1,一般采用P=0.5。對單位不一,初值不同的序列,在計算關(guān)聯(lián)系數(shù)之前應(yīng)首先進行初值化,即將該序列的所有數(shù)據(jù)分別除以第一數(shù)據(jù),將變量化為無單位的相對數(shù)值。關(guān)聯(lián)系數(shù)只表示了各個時刻參考序列和比較序列之間的關(guān)聯(lián)程度,為了從總體上了解序列之間的關(guān)聯(lián)程度,必須求出它們的時間平均值,即關(guān)聯(lián)度。因此,計算關(guān)聯(lián)度
21、的公式為: 將數(shù)據(jù)無量綱化,運用MATLAB編程(附件1.4)直接算出各因素的關(guān)聯(lián)度。如表 8:表 8 各影響因素的關(guān)聯(lián)度級別12345因素農(nóng)村居民人均旅游支出國內(nèi)旅游人數(shù)公路里程城鎮(zhèn)居民人均旅游支出鐵路里程關(guān)聯(lián)度0.83060.78250.77610.76440.7324對表 8分析可知,各影響因素的關(guān)聯(lián)度均大于0.6 時,即通過關(guān)聯(lián)度檢驗。關(guān)聯(lián)度大小排序為:農(nóng)村居民人均旅游支出,國內(nèi)旅游人數(shù),公路里程,城鎮(zhèn)居民人均旅游支出,鐵路里程。故可知農(nóng)村居民人均旅游支出國內(nèi)旅游業(yè)的影響最大。通過以上對關(guān)聯(lián)度的分析,為問題二模型的建立以及求解奠定基礎(chǔ)。五、 問題二的模型與求解5.1引入新變量考慮其他國
22、內(nèi)旅游市場收入的影響因素,為此,通過國家旅游局官網(wǎng)和國家統(tǒng)計局 上收集權(quán)威收據(jù)(below)。在問題一的基礎(chǔ)上引入國內(nèi)旅行社數(shù)量和星級酒店數(shù)量,來分析這兩個因素對國內(nèi)旅游收入的影響。(1)國內(nèi)旅行社數(shù)量隨著旅游業(yè)的不斷發(fā)展,旅行社也開始不斷增多,而旅行社也為人們的旅行帶來了很大的便利以及優(yōu)質(zhì)的旅游體驗服務(wù),使得人們不用為旅行計劃而煩惱,因而間接的增加了旅游收入,對旅游業(yè)的發(fā)展有很大的促進作用。表 9 1994-2014年國內(nèi)旅行社的數(shù)量年份1994199519961997199819992000旅行社數(shù)量2399280132753995491060707725年份200120022003200
23、4200520062007旅行社數(shù)量9222102031199713467146891630317146年份2008200920102011201220132014旅行社數(shù)量18140203992278423690249442605426650(2)星級酒店數(shù)量 酒店行業(yè)是旅游業(yè)的重要支柱產(chǎn)業(yè)之一,其規(guī)模和質(zhì)量是衡量區(qū)域旅游經(jīng)濟發(fā)展水平的重要指標(biāo),是影響國內(nèi)旅游收入的總要因素。因此,將星級酒店數(shù)量也加入到模型中。表 10 1994-2014年國內(nèi)星級酒店的數(shù)量年份1994199519961997199819992000酒店數(shù)量29953720441852015782703510481年份200
24、1200220032004200520062007酒店數(shù)量73588880975110888118281275113583年份2008200920102011201220132014酒店數(shù)量140991423713991135131280713293128035.2引入新變量的多元線性回歸模型在問題一多元線性回歸模型的基礎(chǔ)上,即對b的個系數(shù)置信區(qū)間分析后,并結(jié)合關(guān)聯(lián)度分析,在考慮三個因素的影響即國內(nèi)旅游人數(shù),農(nóng)村居民旅游人均支出,公路里程的基礎(chǔ)上,引入旅行社數(shù)量和星級酒店這兩個因素,并在此利用多元線性回歸模型對國內(nèi)旅游業(yè)的經(jīng)濟收入以及發(fā)展進行預(yù)測分析:因此記旅行社的數(shù)量,星級酒店的數(shù)量。則再次
25、建立出5元回歸模型:,通過Matlab進行求解,并代入回歸方程,得到多元線性回歸方程如下:利用引入新的變量后,在多元回歸模型的基礎(chǔ)上,對2010-2014年國內(nèi)旅游收入的實際值與模擬值進行比較,如表 11表 11 引入新變量旅游收入的實際值與模擬值年份/年20102011201220132014實際值12579.819305.422706.226276.130311.9模擬值13319.419614.123218.825865.429340.2利用MATLAB統(tǒng)計工具箱中命令regress求解并檢驗,得到該模型的回歸系數(shù)估計值及其置信區(qū)間(置信水平=0.05)、檢驗統(tǒng)計量R2,F(xiàn),p的結(jié)果見表
26、 12。表 12 參數(shù)檢驗相關(guān)系數(shù)平方值顯著性F對應(yīng)的概率R2=0.99F=400.41p=0從統(tǒng)計意義分析:相關(guān)系數(shù)平方值R2=0.99,說明模型擬合程度較高。顯著性概率P=0,小于005,故拒絕零假設(shè)。從經(jīng)濟意義分析:在引入的新變量旅行社的數(shù)量和星級酒店的數(shù)量系數(shù)均為負(fù),作出以下說明,當(dāng)旅行社和星級酒店的數(shù)量較少時,國內(nèi)旅游需求較大,旅行社和星級酒店數(shù)量的增加會帶動旅游收入的增長;但當(dāng)旅行社和星級酒店的數(shù)量增加到一定數(shù)量,處于飽和狀態(tài)時,一味的盲目擴張反而會加劇旅游服務(wù)行業(yè)的競爭,導(dǎo)致資源的浪費和經(jīng)濟結(jié)構(gòu)分配不合理,不利于國家旅游經(jīng)濟的發(fā)展,最終使旅游收入減少。從模型估計結(jié)果來看,旅行社和
27、星級酒店數(shù)量的增加并不一定使旅游收入增加,因而提高旅游服務(wù)的質(zhì)量,才是國內(nèi)旅游業(yè)健康發(fā)展的關(guān)鍵。5.3 灰色理論GM(1, N)模型5.3.1 GM(1,N)模型的建立目前使用最廣泛的灰色預(yù)測模型就是關(guān)于數(shù)列預(yù)測的一個變量、一階微分的GM(1,1)模型。它是基于隨機的原始時間序列,經(jīng)按時間累加后所形成的新的時間序列呈現(xiàn)的規(guī)律可用一階線性微分方程的解來逼近。而如果考慮多個相關(guān)因素的影響,也就是多個因子變量影響一個行為變量時,我們就應(yīng)該考慮建立GM(1,N)模型。設(shè)為系統(tǒng)特征數(shù)據(jù)序列,而 為相關(guān)因素序列。為的1-AGO序列(),為的緊鄰生成序列,則稱 (7.3.5)為GM(1,N)灰色微分方程。定
28、義為GM(1,N)灰色微分方程的參數(shù)列,根據(jù)最小二乘法可以得出:式中稱為GM(1,N)灰色微分方程的白化方程,也稱影子方程。近似時間響應(yīng)式為:式子里邊含有累減還原式為 5.3.2 模型的計算與檢驗 利用Matlab進行求解(程序見附件1.5),建立灰色GM(1,N)灰色微分方程利用灰色預(yù)測GM(1,N)模型對2010-2014年國內(nèi)旅游收入的實際值與模擬值進行比較,如表 13表 13 灰色GM(1,N)模擬值和實際值年份/年20102011201220132014實際值12579.819305.422706.226276.130311.9模擬值14354.319256.629762.93537
29、4.637704.03對各個因素進行關(guān)聯(lián)度分析,將數(shù)據(jù)無量綱化,運用MATLAB編程直接算出各因素的關(guān)聯(lián)度。如下表 14:表 14 引入新因素后的關(guān)聯(lián)度級別12345因素農(nóng)村居民人均旅游支出旅行社數(shù)量國內(nèi)旅游人數(shù)公路里程星級酒店數(shù)量關(guān)聯(lián)度0.83170.82480.78390.77760.7192分析可知,關(guān)聯(lián)度要均大于0.6,關(guān)聯(lián)度大小排序為:農(nóng)村居民人均旅游支出,旅行社數(shù)量,國內(nèi)旅游人數(shù),公路里程,星級酒店數(shù)量。故農(nóng)村居民人均旅游支出對國內(nèi)旅游業(yè)的影響最大。在綜合2010-2014年國內(nèi)旅游收入的實際值與模擬值進行的比較以及關(guān)聯(lián)度檢驗的結(jié)果,可以看到灰色GM(1,N)模型的預(yù)測并不十分理想
30、,其中一個原因是GM(1,N)預(yù)測包含一個行為變量和多個因子變量,在預(yù)測時首先對每個因子進行預(yù)測,在利用結(jié)果對行為變量進行預(yù)測,這使得因子預(yù)測誤差一起傳遞給行為變量預(yù)測值,可能產(chǎn)生較大的誤差。5.4 BP神經(jīng)網(wǎng)絡(luò)的旅游預(yù)測模型BP神經(jīng)網(wǎng)絡(luò)是誤差反向傳播的多層前饋網(wǎng)絡(luò)輸人層、隱含層、輸出層組成,可以任意精度逼近任意的連續(xù)函數(shù),主要應(yīng)用于非線性建模函數(shù)逼近模式分類等力面。BP 網(wǎng)絡(luò)學(xué)習(xí)規(guī)則的指導(dǎo)思想是:對網(wǎng)絡(luò)權(quán)值和閾值的修正要沿著表現(xiàn)函數(shù)下降最快的方向負(fù)梯度方向。其中是當(dāng)前的權(quán)值和閾值矩陣,是當(dāng)前表現(xiàn)函數(shù)的梯度,是學(xué)習(xí)速率。假設(shè)三層BP 網(wǎng)絡(luò),輸入節(jié)點:;隱含層節(jié)點:;輸出接點:;輸入節(jié)點于隱含層
31、節(jié)點間的網(wǎng)絡(luò)權(quán)值為;隱含層節(jié)點與輸出接點間的的網(wǎng)絡(luò)權(quán)值為,輸出接點的期望值為, 模型計算公式如下: 隱含層節(jié)點的輸出: 輸出接點的計算輸出:節(jié)點的誤差輸出層:節(jié)點權(quán)值修正輸出層:節(jié)點閾值修正隱含層:節(jié)點權(quán)值修正隱含層:節(jié)點閾值修正:為了在Matlab中計算的方便,在網(wǎng)絡(luò)建立之前,需要對數(shù)據(jù)的大小進行歸一化處理。本文采用的是-1,1歸一化,利用Matlab工具箱中的Premnmx()函數(shù)把數(shù)據(jù)歸一化為單位方差和零均值,這相當(dāng)于把原始數(shù)據(jù)看成服從正態(tài)分布。下面是三層BP神經(jīng)網(wǎng)絡(luò)模型的原理圖:圖 10 三層BP神經(jīng)網(wǎng)絡(luò)圖針對國內(nèi)旅游收入的影響因素,采用5-14-1模型。輸入層為5個神經(jīng)元,各代表一種
32、影響因素,輸出層代表國內(nèi)旅游業(yè)收入。其中輸入層結(jié)點(5個神經(jīng)元)分別代表:國內(nèi)旅游人數(shù)、旅行社數(shù)量、農(nóng)村居民人均旅游支出、公路里程、星級酒店數(shù)量作為輸出結(jié)點。從而得到3層前饋反向傳播神經(jīng)網(wǎng)絡(luò)模型。通過train函數(shù)對已生成的網(wǎng)絡(luò)進行學(xué)習(xí)訓(xùn)練,如圖 11圖 11 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)訓(xùn)練參數(shù)設(shè)置參數(shù):訓(xùn)練次數(shù):net.trainParam.epochs=20000目標(biāo)誤差:net.trainParam.goal=1e-6學(xué)習(xí)速度:net.trainParam.lr=0.001。圖 12 BP神經(jīng)網(wǎng)絡(luò)性能對BP神經(jīng)網(wǎng)絡(luò)模型進行多次分組訓(xùn)練,各因素數(shù)據(jù)作為網(wǎng)絡(luò)輸入數(shù)據(jù)進行下一步的網(wǎng)絡(luò)訓(xùn)練,利用Matla
33、b進行訓(xùn)練預(yù)測(程序見附件1.6)得到的預(yù)測值,如下表 15表 15 BP神經(jīng)網(wǎng)絡(luò)預(yù)測值與實際值年份實際值模擬值百分比相對誤差19941023.51020.410.00302119951375.71365.360.007519419961638.41631.670.004109219972112.72113.32-0.0002919919982391.22399.10-0.003305519992831.92842.08-0.003596320003175.53189.11-0.004286220013522.43509.910.003544720023878.43896.43-0.00464
34、8420033442.33448.58-0.001824620044710.74718.47-0.001649920055285.95298.32-0.002349120066229.76244.30-0.002343620077770.67778.19-0.0009771220088749.38752.27-0.00033984200910183.710186.24-0.00024909201012579.812568.440.00090292201119305.419304.920.00002493201222706.222709.89-0.00016235201326276.126280
35、.96-0.00018481201430311.930313.00-0.000036441圖 13預(yù)測值與實際值誤差比較比較由模型得出的模擬值與實際值(如圖 13),并結(jié)合所得誤差,顯然我們可以發(fā)現(xiàn)用BP神經(jīng)網(wǎng)絡(luò)模型對國內(nèi)旅游市場收入進行預(yù)測是一種非常理想的方法,BP神經(jīng)網(wǎng)絡(luò)有很好的自學(xué)習(xí)性和能很好的反映數(shù)據(jù)之間的線性無關(guān)性,也能方便的用matlab軟件對數(shù)據(jù)進行分析,預(yù)測結(jié)果比較準(zhǔn)確。六、 模型評價6.1 MAPE評價為了驗證以上各種模型的可行性,我們選取2010-2014年的數(shù)據(jù),并進行實際值,預(yù)測值以及平均絕對誤差的比對,見表 16。 表 16 2010-2014年各模型預(yù)測值與實際值年
36、份實際國內(nèi)旅游收入BP神經(jīng)網(wǎng)絡(luò)測得值灰色理論測得值多元線性回歸測得值201012579.812568.414354.313319.4201119305.419304.219256.619614.1201222706.222709.929762.923218.8201326276.126280.935374.625865.4201430311.930313.037704.029340.2本文用MAPE(絕對平均誤差%)這個參數(shù)來評價模型的精確度,其計算公式為:式中:代表模型預(yù)測輸出值;是實際旅游收入。在這里n取2,i =1,2,3,4,5。用Matlab求解(程序見附件1.7)得幾個模型的MAP
37、E值見表 17。表 17 三種模型的絕對平均誤差預(yù)測模型BP神經(jīng)網(wǎng)絡(luò)多元回歸分析灰色GM(1,N)MAPE0.0003380.0362610.261126MAPE是一個模型預(yù)測精確度的評價指標(biāo) ,用于評價模型預(yù)測值與實際值的相關(guān)性。MAPE值越小,表示模型的預(yù)測效果越好。由上表可以看出 ,神經(jīng)網(wǎng)絡(luò)模型的預(yù)測效果比其他的模型好,說明BP神經(jīng)網(wǎng)絡(luò)對國內(nèi)旅游收入的預(yù)測更加合理可行。在本文中針對國內(nèi)旅游收入各因素的影響,分別從時間序列的角度建立三個模型,以及多變量影響的角度建立了三個模型來對國內(nèi)旅游市場收入進行預(yù)測,這六個個模型各有特點,以下就優(yōu)缺點再次進行評價。6.2優(yōu)點一元多項式回歸模型和指數(shù)模型
38、能較好的就行線性擬合反映數(shù)據(jù)的走向而多元線性回歸模型和多元非線性模型能夠充分的體現(xiàn)各影響因素對旅游收入的影響,在多因素決策問題上應(yīng)用廣泛,它能很好的反映不同因素對總體的貢獻程度和各因素之間的比重大小。灰色預(yù)測GM(1,N)模型通過關(guān)聯(lián)度檢驗,可以更好的反映各影響因素的關(guān)聯(lián)程度,BP神經(jīng)網(wǎng)絡(luò)應(yīng)用范圍更加廣泛,能很好的反映數(shù)據(jù)的特性。以及識別訓(xùn)練樣本中相關(guān)參數(shù)之間的非線性特征,而且有較強的容錯性和很強的自適應(yīng)學(xué)習(xí)能力。6.3缺點多元回歸模型:單因素與預(yù)測值之間必須大致是線性關(guān)系,靈活性差。對已有數(shù)據(jù)預(yù)測另一單因素準(zhǔn)確,但有數(shù)據(jù)缺失的情況預(yù)測效果差。BP網(wǎng)絡(luò)神經(jīng)模型:存在局部極小值問題,算法收斂速度
39、慢,隱層單元數(shù)目的選取無一般指導(dǎo)原則。關(guān)聯(lián)度分析:該方法只對于問題中一些可以進行量化的因素分析,而不能將與問題相關(guān)且不能量化的因素考慮在內(nèi)?;疑碚揋M(1,N)模型:該模型要求未來的數(shù)據(jù)要和過去的以及現(xiàn)在的數(shù)據(jù)有相同的發(fā)展趨勢, 上下波動不能太大,否則會在某一時刻產(chǎn)生較大的偏差。且因子預(yù)測誤差會傳遞給行為變量預(yù)測值,可能產(chǎn)生較大的誤差。七、 模型推廣綜合以上分析,針對國內(nèi)旅游收入發(fā)展所作的各種模型,可以通過對研究對象的分析,選取適應(yīng)的模型進行發(fā)展趨勢的預(yù)測,進而這些模型可以推廣到對國內(nèi)旅游需求、旅游人數(shù)等進行預(yù)測,同時也可應(yīng)用于各個領(lǐng)域,如國家財政收入、中國的人口預(yù)測、工廠的產(chǎn)值預(yù)測等。八、
40、 參考文獻1 李艷嬌, 李瑞敏, 陳經(jīng)偉. 多元線性回歸的MATLAB實現(xiàn)J. 常熟理工學(xué)院學(xué)報, 2014(2):49-52.2 包翠蓮, 開小明. MATLAB語言在多元線性回歸中的應(yīng)用J. 安徽教育學(xué)院學(xué)報, 2005, 23(3):55-56.3 董大校. 基于MATLAB的多元非線性回歸模型J. 云南師范大學(xué)學(xué)報:自然科學(xué)版, 2009, 29(2):45-48.4 陳紹東. 改進的灰色GM(1,N)模型在經(jīng)濟中的預(yù)測與應(yīng)用J. 宜春學(xué)院學(xué)報, 2010, 32(4):65-66.5 阮氏海寧, 溫作民. 基于灰色GM(1,N)的生態(tài)旅游市場需求預(yù)測研究以越南風(fēng)雅-格邦國家公園為例J
41、. 綠色科技, 2013(1):238-240.6 夏冰, 陳東彥, 潘狀元. 基于BP神經(jīng)網(wǎng)絡(luò)的旅游需求預(yù)測J. 中國集體經(jīng)濟, 2009(21):144-145.九、 附件1.1中國國內(nèi)旅游收入1994-2014年相關(guān)數(shù)據(jù) 年份國內(nèi)旅游收入(億元)國內(nèi)旅游人數(shù)(百萬人次)城鎮(zhèn)居民人均旅游支出(元)農(nóng)村居民人均旅游支出(元)公路里程(萬公里)鐵路里程(萬公里)19941023.5524414.754.9111.785.9019951375.7629464.061.5115.706.2419961638.4640534.170.5118.586.4919972112.7644599.8145.
42、7122.646.6019982391.2695607.0197.0127.856.6419992831.9719614.8249.5135.176.7420003175.5744678.6226.6167.986.8720013522.4784708.3212.7169.807.0120023878.4878739.7209.1176.527.1920033442.3870684.9200.0180.987.3020044710.71102731.8210.2187.077.4420055285.91212737.1227.6334.527.5420066229.71394766.4221.
43、9345.707.7120077770.61610906.9222.5358.377.8020088749.31712849.4275.3373.027.97200910183.71902801.1295.3386.088.55201012579.82103883.0306.0400.829.12201119305.42641877.8471.4410.649.32201222706.22957914.5491.0423.759.76201326276.13262946.6518.9435.6210.31201430311.93611975.4540.2446.3911.18數(shù)據(jù)來源:中國統(tǒng)計
44、年鑒2015Matlab相關(guān)程序1.2多元非線性回歸模型load('X.mat') %各影響因素數(shù)據(jù)y=1023.5 1375.7 1638.4 2112.7 2391.2 2831.9 3175.5 3522.4 3878.4 3442.3 4710.7.5285.9 6229.7 7770.6 8749.3 10183.7 12579.8 19305.4 22706.2 26276.1 30311.9' %國內(nèi)旅游市場收入beta0=ones(5,1);% beta= nlinfit(X,y,'model',beta0)beta,r,J= nlinf
45、it(X,y,'model',beta0) % r為殘差,% nlintool(X,y,'model',beta0)stepwise(X,y)1.3多元線性回歸方程%未改進前各因素的多元線性回歸分析y=1023.5 1375.7 1638.4 2112.7 2391.2 2831.9 3175.5 3522.4 3878.4 3442.3 4710.7 5285.9 6229.7 7770.6 8749.3 10183.7 12579.8 19305.4 22706.2 26276.1 30311.9'x1=524 629 640 644 695 719
46、 744 784 878 870 1102 1212 1394 1610 1712 1902 2103 2641 2957 3262 3611'x2=414.7 464 534.1 599.8 607 614.8 678.6 708.3 739.7 684.9 731.8 737.1 766.4 906.9 849.4 801.1 883 877.8 914.5 946.6 975.4'x3=54.9 61.5 70.5 145.7 197 249.5 226.6 212.7 209.1 200 210.2 227.6 221.9 222.5 275.3 295.3 306 4
47、71.4 491 518.9 540.2'x4=111.78 115.7 118.58 122.64 127.85 135.17 167.98 169.8 176.52 180.98 187.07 334.52 345.7 358.37 373.02 386.08 400.82 410.64 423.75 435.62 446.39'x5=5.9 6.24 6.49 6.6 6.64 6.74 6.87 7.01 7.19 7.3 7.44 7.54 7.71 7.8 7.97 8.55 9.12 9.32 9.76 10.31 11.18'x=ones(21,1) x
48、1 x2 x3 x4 x5;b,bint,r,rint,stats=regress(y,x)rcoplot(r,rint);%分析關(guān)聯(lián)度,以及對b的個系數(shù)置信區(qū)間分析后,只研究以下三個因素的影響y=1023.5 1375.7 1638.4 2112.7 2391.2 2831.9 3175.5 3522.4 3878.4 3442.3 4710.7 5285.9 6229.7 7770.6 8749.3 10183.7 12579.8 19305.4 22706.2 26276.1 30311.9'%g國內(nèi)旅游人數(shù)x1=524 629 640 644 695 719 744 784 8
49、78 870 1102 1212 1394 1610 1712 1902 2103 2641 2957 3262 3611'%農(nóng)村居民人均旅游支出x3=54.9 61.5 70.5 145.7 197 249.5 226.6 212.7 209.1 200 210.2 227.6 221.9 222.5 275.3 295.3 306 471.4 491 518.9 540.2'%公路里程x4=111.78 115.7 118.58 122.64 127.85 135.17 167.98 169.8 176.52 180.98 187.07 334.52 345.7 358.3
50、7 373.02 386.08 400.82 410.64 423.75 435.62 446.39' x=ones(21,1) x1 x3 x4;b,bint,r,rint,stats=regress(y,x)%加入旅行社數(shù)量,星級酒店數(shù)量的因素后,多元線性規(guī)劃y=1023.5 1375.7 1638.4 2112.7 2391.2 2831.9 3175.5 3522.4 3878.4 3442.3 4710.7 5285.9 6229.7 7770.6 8749.3 10183.7 12579.8 19305.4 22706.2 26276.1 30311.9'%g國內(nèi)旅
51、游人數(shù)x1=524 629 640 644 695 719 744 784 878 870 1102 1212 1394 1610 1712 1902 2103 2641 2957 3262 3611'%旅行社數(shù)量x2=3399 2801 3275 3995 4910 6070 7725 9222 10203 11997 13467 14689 16303 17146 18140 20399 22784 23690 24944 26054 26650'%農(nóng)村居民人均旅游支出x3=54.9 61.5 70.5 145.7 197 249.5 226.6 212.7 209.1 2
52、00 210.2 227.6 221.9 222.5 275.3 295.3 306 471.4 491 518.9 540.2'%公路里程x4=111.78 115.7 118.58 122.64 127.85 135.17 167.98 169.8 176.52 180.98 187.07 334.52 345.7 358.37 373.02 386.08 400.82 410.64 423.75 435.62 446.39'% 星級酒店的數(shù)量x5=2995 3720 4418 5201 5782 7035 10481 7358 8880 9751 10888 11828 12751 13583
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 產(chǎn)業(yè)扶貧幫扶合同范例
- 供酒店食品合同范例
- 與購房中介合同范例
- 個人增資入股合同范本
- 基于不平衡數(shù)據(jù)的茄子病害分類
- 產(chǎn)品開發(fā)協(xié)議合同范例
- 冰庫買賣合同范例
- 個人終止房屋買賣合同范例
- 教育教學(xué)論文-淺談提高物理課堂教學(xué)質(zhì)量的途徑與方法
- 偽造訂單合同范例
- 醫(yī)院內(nèi)控評價工作報告
- 2021年10月自考00150金融理論與實務(wù)試題及答案含解析
- 智慧化除塵器及控制系統(tǒng)解決方案
- 急診預(yù)檢分診培訓(xùn)
- 建筑垃圾商業(yè)計劃書
- 2024年蘭州市高三診斷考試(一診)地理試卷(含答案)
- 2024春蘇教版《亮點給力大試卷》 數(shù)學(xué)四年級下冊(全冊有答案)
- 小學(xué)中高年級語文整本書閱讀教學(xué)策略
- 2024年青島版數(shù)學(xué)五年級下冊第一單元、第二單元測試題及答案(各一套)
- 自行車的力學(xué)知識研究報告
- 《高危藥品管理》課件
評論
0/150
提交評論