數(shù)模作業(yè)主成分分析 世博會人流量_第1頁
數(shù)模作業(yè)主成分分析 世博會人流量_第2頁
數(shù)模作業(yè)主成分分析 世博會人流量_第3頁
數(shù)模作業(yè)主成分分析 世博會人流量_第4頁
數(shù)模作業(yè)主成分分析 世博會人流量_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 題目: 愛知世博會人流量影響因素分析及預(yù)測§1、摘要 本論主要探討了愛知世博會期間人流量的影響因素及預(yù)測次日世博會的人流量問題,通過主成分分析法研究影響人流量的主要因子。 第一步,對給出的數(shù)據(jù)進行分析。用EXECL表格制作每日人流量的散點圖,根據(jù)問題以及問題二,有針對性的提出主成分分析法,借助SPSS軟件予以解答。 關(guān)鍵詞:世博會 人流量 主成分分析 §2、問題的提出要解決的問題主要有兩個:1. 分析世博會期間影響游客數(shù)量的的主要因子;2.解析這些因子對游客數(shù)量的影響機制,建立這些因子與一天游客數(shù)量的數(shù)學(xué)關(guān)系; §3、問題的分析經(jīng)過考慮,我們首先應(yīng)圍繞題目尋找相

2、關(guān)數(shù)據(jù)進行統(tǒng)計分析,建立日期與人流量的X-Y散點圖。依據(jù)題目要求,需要分析影響人流量的主要因子,我們分析人流量的單個因素影響,主要有日期,周雙休日,假期,天氣等的影響。通過主成分分析法,找出主要的影響成分,分析模型,通過擬合度檢驗,我們對原有的模型進行進一步的修正。問題二主要基于時間序列分析,通過建立時間序列模型來預(yù)測次日人流量。并進行時間平穩(wěn)檢驗,對模型進行修正。 §4 模型假設(shè)1. 假設(shè)愛知世博會期間,沒有自然災(zāi)害等突發(fā)事件發(fā)生,天氣變化和往年無多大差異。2. 假設(shè)愛知世博會期間,交通、通訊設(shè)備正常,沒有重大事故等突發(fā)事件的發(fā)生。3. 假設(shè)愛知世博會的場館可以容納無數(shù)的游客。4.

3、 假設(shè)愛知世博會期間,沒有重大影響游客量的事件發(fā)生。 §5 模型的準備選定模型之前,首先對數(shù)據(jù)進行分析。1、 根據(jù)Excel統(tǒng)計日數(shù)如流量的散點圖。類似于時三次曲線,先將日數(shù)的三次方作為一個影響因素錄入。2、 從數(shù)據(jù)中,明顯涉及到的因素有日期,星期,天氣和節(jié)假日四個因素,通過對相關(guān)的蚊香的閱讀,找出世博會的日訪問量與世博會在群眾中的知曉度有關(guān),隨著時間的推進,將會有越來越多的游客游訪世博會。指定S代表世博的階段,并賦值。符號含義D日期D2日期的平方D3日數(shù)的立方S世博階段W天氣F周末T節(jié)假日世博前30天,S=1,后30天S=3,中間,S=1天氣W 晴時,W=1,多云時,W=0,下雨時

4、 W=-1,只要有雨,都是-1周末 F 工作日周一至周五 F=0,周六,F(xiàn)=2,周日F=1節(jié)假日T 假日時 T=1,非假日時,T=0§6 模型的建立與求解(一) 問題一根據(jù)問題及我們對相關(guān)知識的了解,決定用主成分分析法來解決這個問題。下面進行詳細介紹。在很多情形,變量之間是有一定的相關(guān)關(guān)系的,當(dāng)兩個變量之間有一定相關(guān)關(guān)系時,可以解釋為這兩個變量反映此課題的信息有一定的重疊。主成分分析是對于原先提出的所有變量,建立盡可能少的新變量,使得這些新變量是兩兩不相關(guān)的,而且這些新變量在反映課題的信息方面盡可能保持原有的信息。設(shè) 是一個p維隨機向量,且,協(xié)方差矩陣D(X)=V??紤]它的線性變換:

5、如果滿足:;則稱,是X的第一主成分。是在X的所有線性組合中最能綜合P個變量信息的一個特殊的線性組合。如果一個主成分不足以代表原P個變量所包含的信息,就考慮采用。為了最有效地代表原變量的信息,原有的信息就不需要出現(xiàn)在中,即滿足,于是求,使其滿足。此時的稱為是第二主成分。類似可得第三主成分,第四主成分等等。(二) 主成分分析步驟 主成分分析常常通過以下四步來處理:(1)對原P個指標的n×p個原始數(shù)據(jù)標準化。目的是為了消除變量間在數(shù)量級上火量綱上的不同而產(chǎn)生的影響,以使每個變量的平均值為0,方差為1.變換標準化的公式為:其中和分別是第j個變量的平均差和標準差。(2)根據(jù)標準化矩陣求出協(xié)方差

6、矩陣(與相關(guān)陣完全一樣)。(3)求出協(xié)方差矩陣的特征根和特征向量。(4)確定主成分,結(jié)合專業(yè)知識給個主成分所蘊藏的信息給予恰當(dāng)?shù)慕忉?,并利用它們來判斷樣品的特性?.通過SOSS軟件進行主成分分析圖表如下:表1.1 相關(guān)統(tǒng)計量表1.2 相關(guān)矩陣表1.3 變量的共同度表1.4 解釋總方差表1.5 碎石圖表1.6因子負荷矩陣表1.7 因子得分系數(shù)矩陣2.圖形分析 (1)由表1.2可知,各變量之間存在較強的相關(guān)關(guān)系,因此有必要進行主成分分析。表中的空格表明自身相關(guān)的相關(guān)系數(shù)為1,豈不相關(guān)的顯著性概率為0,因此不再顯示; (2)由表1.3可知,變量的共同度對所有變量都是1,表明模型解釋了每一個變量的全

7、部方差,而不需要特殊因子,即特殊因子的方差為0;(3)由表1.4可知,變量相關(guān)陣有兩個最大特征根,即4.125和1,131,他們一起解釋總方差的75.085%(累計貢獻率),這說明前兩個主成分提供了原始數(shù)據(jù)的主要信息?;谶^程內(nèi)定取特征值大于1的規(guī)定,F(xiàn)actor過程提取了兩個主成分;(4)由表可看出第一個主成分與第二個主成分的特征根大于1。,而其他主成分的特征根小于1,可以認為前兩個主成分能概括絕大部分信息 ;(5)由表1.7知,第一主成分、第二主成分與原始變量的關(guān)系,可用下列線性組合表示:(三) 問題二表2.1引入/刪除變量表2.2 模型摘要表2.3 方差分析表2.4 系數(shù)表2.5數(shù)據(jù)分析

8、 (1) 表2.1顯示變量引入辦法為全部引入法;(2) 表2.2顯示了負相關(guān)系數(shù)R=0.906 可決系數(shù)R2 =0.806,估計標準誤差S=20020.09;(3) 表2.3顯示了方差分析的結(jié)果,P=0<0.05,可以認為變量與D ,D2,D3,S,W,F,T之間的線性關(guān)系顯著;(4) 表2.4顯示模型中的回歸系數(shù)、常熟及t檢驗的結(jié)果,從表中可以看到t檢驗的P值:D,D2,D3,S和F的回歸系數(shù)均為0,W的回歸系數(shù)為0.001,T的回歸系數(shù)為0.006.表2.2中,R Square 和Adjusted R Square 均超過81%,說明模型擬合平穩(wěn)性較好。表2.4中,已經(jīng)可以得到回歸方程的系數(shù)。Y=-1469.171+2602.968D-30.752D2+0.1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論