




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、空氣污染爭(zhēng)辯的主成分分析一、提出問(wèn)題本文對(duì)于給定的某城市42天中午12點(diǎn)的空氣污染數(shù)據(jù)進(jìn)行主成分分析,主要解決以下幾個(gè)問(wèn)題:(1) 分別用樣本協(xié)方差矩陣和樣本相關(guān)矩陣作主成分分析,對(duì)比二者的結(jié)果差異;(2) 對(duì)原始數(shù)據(jù)的變化選取三個(gè)或者更少的主成分反映,并對(duì)所選的主成分做出解釋。二、分析問(wèn)題主成分分析旨在利用降維的思想,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo)。在實(shí)際問(wèn)題爭(zhēng)辯中,為了系統(tǒng)、全面地分析問(wèn)題,我們必需考慮眾多影響因素。由于每個(gè)因素都在不同程度上反映了所爭(zhēng)辯問(wèn)題的某些信息,并且指標(biāo)之間有肯定的相關(guān)性,因而所得到的統(tǒng)計(jì)數(shù)據(jù)反映的信息在肯定程度上有重疊。本文中所爭(zhēng)辯的問(wèn)題變量較多,因此利用主成分分
2、析法爭(zhēng)辯本問(wèn)題,削減計(jì)算量和降低分析問(wèn)題的簡(jiǎn)單性。針對(duì)問(wèn)題一,首先將數(shù)據(jù)標(biāo)準(zhǔn)化,計(jì)算樣本協(xié)方差矩陣和相關(guān)矩陣,然后分別計(jì)算樣本協(xié)方差矩陣和相關(guān)矩陣的特征值和特征向量,貢獻(xiàn)率和累計(jì)貢獻(xiàn)率,確定選取成分個(gè)數(shù),列出主成分方程并解釋主成分意義。針對(duì)問(wèn)題二,考慮主成分的貢獻(xiàn)率,只要主成分的累計(jì)貢獻(xiàn)率達(dá)到80%,就可以反映原始數(shù)據(jù)的變化,并且對(duì)所選取的主成分做出解釋。三、模型假設(shè)1、影響污染程度的變量只有本文中所提到的變量;2、隨機(jī)選取的42天;3、題目中所提到的城市是平衡進(jìn)展,政府對(duì)環(huán)境治理干預(yù)較小,即此城市的環(huán)境不會(huì)消滅猛烈波動(dòng);4、題目中所給的污染濃度及氣象參數(shù)有效,數(shù)據(jù)都精確牢靠,同時(shí)不考慮人為因
3、素、檢測(cè)儀器精確度不同等影響。四、符號(hào)說(shuō)明符號(hào)符號(hào)含義樣本方差原始變量樣本主成分樣本協(xié)方差樣本相關(guān)矩陣樣本平均值協(xié)方差矩陣特征向量矩陣矩陣的特征值矩陣的特征向量信息提取率五、問(wèn)題求解5.1協(xié)方差矩陣主成分分析設(shè)是的協(xié)方差矩陣,的特征值與正交化特征向量分別為及,且的第個(gè)主成分為 (1)依據(jù)已有數(shù)據(jù)計(jì)算得樣本的均值向量為依據(jù)協(xié)方差矩陣計(jì)算公式 (2)代入數(shù)據(jù)可求得隨機(jī)變量相應(yīng)的樣本協(xié)方差矩陣為利用特征值計(jì)算公式代入數(shù)據(jù)可求得的特征值與對(duì)應(yīng)單位正交化特征向量分別為,, 利用第個(gè)主成分的貢獻(xiàn)率 (3)及前個(gè)主成分的累計(jì)貢獻(xiàn)率 (4)代入數(shù)據(jù)計(jì)算得的各標(biāo)準(zhǔn)化主成分的貢獻(xiàn)率及累計(jì)貢獻(xiàn)率(如表1所示),可以
4、看出,前三個(gè)標(biāo)準(zhǔn)化樣本的累計(jì)貢獻(xiàn)率已經(jīng)達(dá)到98.6968%,故只需提取前三個(gè)主成分即可:表1 的各標(biāo)準(zhǔn)化主成分的貢獻(xiàn)率及累計(jì)貢獻(xiàn)率貢獻(xiàn)率(%)累計(jì)貢獻(xiàn)率(%)1304.257987.294887.2948228.27618.112795.4075311.46453.289398.696842.52430.724299.421051.27950.367199.788160.52870.151799.939870.20960.0601100.0000記主成分向量為 由 ,知的前三個(gè)主成分分別為因此,用前三個(gè)主成分代替原來(lái)7個(gè)變量,信息損失量較小。進(jìn)一步由與的相關(guān)系數(shù) (5)計(jì)算出前三個(gè)主成分與各原
5、始變量的相關(guān)系數(shù)如下表:主成分相關(guān)系數(shù)原變量表2 前三個(gè)主成分與各原始變量的相關(guān)系數(shù)0.10870.2576-0.0672-0.99940.0357-0.0014-0.1937-0.41810.46750.07400.06260.4111-0.1274-0.23690.9585-0.3521-0.9299-0.1041-0.0613-0.18240.4168由表可看出,與相關(guān)度較高,而由相關(guān)矩陣的主成分權(quán)重系數(shù)(即特征向量中的各個(gè)值)知,太陽(yáng)輻射對(duì)空氣污染的影響最大;與相關(guān)度較高,由相關(guān)矩陣的主成分權(quán)重系數(shù)(即特征向量中的各個(gè)值)知,對(duì)空氣污染的影響較大;與相關(guān)度較高,同理,由相關(guān)矩陣的主成分
6、權(quán)重系數(shù)(即特征向量中的各個(gè)值)知,對(duì)空氣污染的影響較大。考慮前三個(gè)主成分的貢獻(xiàn)率依次降低,得出結(jié)論:影響空氣污染的最重要因素為太陽(yáng)輻射。由于的方差較大,第一主成分主要由變量把握,所以所得結(jié)論與實(shí)際不符。5.2樣本相關(guān)矩陣主成分分析利用標(biāo)準(zhǔn)化公式對(duì)原數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理得到一組新的數(shù)據(jù):即令 (6)其中為的平均值,為的方差。此時(shí),由于的協(xié)方差矩陣即為的相關(guān)矩陣其中 (7) 為的協(xié)方差。代入數(shù)據(jù)計(jì)算得到樣本相關(guān)矩陣為利用特征值計(jì)算公式代入數(shù)據(jù)可求得的特征值與單位正交化特征向量分別為利用第個(gè)主成分的貢獻(xiàn)率 (8)及前個(gè)主成分的累計(jì)貢獻(xiàn)率 (9)其中。計(jì)算的各標(biāo)準(zhǔn)化主成分的貢獻(xiàn)率及累計(jì)貢獻(xiàn)率(如表3所
7、示)。表3 的各標(biāo)準(zhǔn)化主成分的貢獻(xiàn)率及累計(jì)貢獻(xiàn)率貢獻(xiàn)率(%)累計(jì)貢獻(xiàn)率(%)12.336833.382433.382421.386019.799753.182131.204117.201270.383340.727110.387080.770350.65359.335690.105960.53677.667097.772970.15592.2271100.00可以看出,當(dāng)特征值大于1時(shí),提取前三個(gè)標(biāo)準(zhǔn)化樣本的累計(jì)貢獻(xiàn)率為70.3833%。記主成分向量為 由 ,則的前三個(gè)主成分分別為由與的相關(guān)系數(shù) (10)計(jì)算出前三個(gè)主成分與各原始變量的相關(guān)系數(shù)如表:主成分相關(guān)系數(shù)原變量表4 前三個(gè)主成分與各原
8、始變量的相關(guān)系數(shù)-0.36810.32550.69360.3145-0.62020.25020.8307-0.0046-0.14670.59270.5123-0.43730.74520.23050.23500.4922-0.67140.17450.48840.35530.6072由表4可看出,與、相關(guān)度較高,近似是7個(gè)變量的等權(quán)重之和,反映了空氣質(zhì)量的綜合指標(biāo),值越大,空氣質(zhì)量越差。與相關(guān)度較低,由相關(guān)矩陣的主成分權(quán)重系數(shù)(即特征向量中的各個(gè)值)知,CO對(duì)空氣污染指標(biāo)y2的影響較小;與、相關(guān)度較高,同理,由相關(guān)矩陣的主成分權(quán)重系數(shù)(即特征向量中的各個(gè)值)知,風(fēng)速和HC對(duì)空氣污染的影響較大??紤]
9、前三個(gè)主成分的貢獻(xiàn)率之和達(dá)到70.3833%,因此綜合考慮來(lái),和來(lái)評(píng)判影響空氣污染的重要指標(biāo)。5.3差異性從協(xié)方差矩陣動(dòng)身,對(duì)全部變量進(jìn)行主成分分析,何從相關(guān)矩陣動(dòng)身做主成分分析,兩個(gè)方向得出的結(jié)果顯示,原變量在第一主成分和其次主成分中的相對(duì)重要性,由于標(biāo)準(zhǔn)化而有很大變化。從協(xié)方差矩陣的角度進(jìn)行主成分分析,所得第一主成分中,權(quán)重系數(shù)分別為-0.01、0.9922、0.941、-0.0047、0.0243、0.1124、0.0023,二重相對(duì)矩陣的角度進(jìn)行主成分分析,所得的第一主成分分析,權(quán)重系數(shù)為-0.238、0.2056、0.5511、0.3776、0.4980、0.3246、0.3194。
10、兩者差距很大,并且在其次主成分中的兩個(gè)系數(shù)相差更遠(yuǎn)。因此,由協(xié)方差矩陣和相關(guān)矩陣所得的主成分一般是不同的。為了滿足樣本主成分累計(jì)貢獻(xiàn)率達(dá)到80%以上,從相關(guān)矩陣動(dòng)身做的主成分分析應(yīng)保留4個(gè)主成分,而從協(xié)方差矩陣來(lái)看,只保留1個(gè)主成分即可。由此可知,用協(xié)方差矩陣進(jìn)行主成分分析更能簡(jiǎn)化運(yùn)算。本文中,由于設(shè)計(jì)的各變量的變化范圍差異不大,因此應(yīng)從先關(guān)矩陣動(dòng)身求主成分比較合理。近似是7個(gè)變量的等權(quán)重之和,反映了空氣質(zhì)量的綜合指標(biāo),值越大,空氣質(zhì)量越差。綜合考慮來(lái),和來(lái)評(píng)判影響空氣污染的重要指標(biāo)。六、模型評(píng)價(jià)模型優(yōu)點(diǎn):(1) 用主成分分析方法能夠較好地揭示污染物于污染程度之間的關(guān)系;(2) 該模型所用工具較易操作;(3) 主成分分析法是從定量的角度動(dòng)身,充分利用全部數(shù)據(jù)當(dāng)中所包含的信息。所確定的指標(biāo)權(quán)數(shù)是基于數(shù)據(jù)分析而得到的指標(biāo)間的內(nèi)在結(jié)構(gòu)關(guān)系,具有較好的客觀性;能有效消退不相關(guān)指標(biāo)的影響,從而可進(jìn)行有針對(duì)性的定量化評(píng)價(jià);得到的綜合指標(biāo)之間相互獨(dú)立,不僅簡(jiǎn)化了評(píng)價(jià)系統(tǒng),還削減了信息的交叉和冗余。(4) 方法計(jì)算簡(jiǎn)便,數(shù)學(xué)物理意義明確,有較強(qiáng)的可操作性和肯定的推廣應(yīng)用。模型缺點(diǎn):(1) 尚未考慮到其他變量的影響,存在猜測(cè)誤差;(2) 該模型未給出圖像,難以反映各變量對(duì)空氣污
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 合肥特殊疾病管理辦法
- 學(xué)校三年發(fā)展規(guī)劃實(shí)施成果評(píng)估與反思總結(jié)報(bào)告
- 江蘇紅酒倉(cāng)儲(chǔ)管理辦法
- 回遷工作經(jīng)費(fèi)管理辦法
- 非物質(zhì)文化遺產(chǎn)保護(hù)策略研究
- 余杭房屋租賃管理辦法
- 請(qǐng)假休假管理:全面指南與實(shí)施建議
- 安全生產(chǎn)與文明施工綜合實(shí)施方案
- 公司個(gè)人借支管理辦法
- 農(nóng)場(chǎng)人口管理辦法細(xì)則
- 拍賣公司員工培訓(xùn)考核管理制度
- 廣東省行業(yè)企業(yè)職業(yè)技能競(jìng)賽技術(shù)工作指引
- 浙江2025年6月高一學(xué)考模擬歷史試題及答案
- 2025年計(jì)算機(jī)程序設(shè)計(jì)考試試卷及答案
- 2025年河南省中考數(shù)學(xué)真題含答案
- 人力中介公司管理制度
- 抗精神病藥氯丙嗪講課件
- 2025人教英語(yǔ)初中八年級(jí)下冊(cè)期末測(cè)試卷(含答案)
- 燃?xì)馊霊艋卦L管理制度
- 燃?xì)夤居?jì)量管理制度
- 綜合與實(shí)踐 白晝時(shí)長(zhǎng)規(guī)律的探究 同步練習(xí)(含答案)人教版七年級(jí)數(shù)學(xué)下冊(cè)
評(píng)論
0/150
提交評(píng)論