版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、基于主成分分析的世界主要城市空氣污染的研究海 南 大 學(xué)畢 業(yè) 論 文(設(shè)計) 題 目:基于主成分分析的世界主要城市空氣污染的研究 學(xué) 號: 姓 名: 年 級:2009級 學(xué) 院:信息科學(xué)技術(shù)學(xué)院 系 別:數(shù)學(xué)系 專 業(yè):信息與計算科學(xué) 指導(dǎo)教師: 完成日期:2013年4月30日 摘 要隨著人口的高速增長,工農(nóng)業(yè)的高速發(fā)展,人類活動對大氣環(huán)境的影響越來越大。有些大氣環(huán)境問題也越來越突出,如全球變暖、臭氧層遭破壞和酸雨的危害等。有些大氣污染所造成的危害已經(jīng)沒有了國界的限制,形成了全球性大氣污染,成為與世界各國都有直接利害關(guān)系的問題。全球性大氣污染已引起了世界各國的普遍關(guān)注。要解決這個問題,需要各
2、國協(xié)調(diào)一致的行動,不論是發(fā)達(dá)國家還是發(fā)展中國家,都應(yīng)為此進(jìn)行努力,在公平合理的原則基礎(chǔ)上,承擔(dān)起各自的責(zé)任與義務(wù)。治理空氣污染已經(jīng)到了刻不容緩的時刻。本文主要運用SAS軟件對中國統(tǒng)計年鑒2005年到2011年世界主要城市空氣污染狀況數(shù)據(jù)進(jìn)行主成分分析,去除由總懸浮顆粒物、二氧化碳和二氧化硫三個污染因子衡量空氣污染程度的冗余,得出主成分,使其保留原有指標(biāo)的主要信息,成為衡量城市污染狀況的唯一指標(biāo),以便方便地獲得一個城市的空氣污染狀況,并采取相應(yīng)的措施治理該城市的環(huán)境污染。關(guān)鍵詞:環(huán)境污染;主成分分析;貢獻(xiàn)率;環(huán)境保護(hù)AbstractWith the rapid growth and develo
3、pment of the population, industry and agriculture, the influence of human activities on the atmospheric environment is more and more big. Some of the atmospheric environmental problem is becoming more and more prominent, such as global warming, ozone layer destruction and the harm of acid rain, etc.
4、 Some harm has been caused by air pollution without the national borders restrictions, formed the global atmospheric pollution, become a direct interest with all countries in the world. Global air pollution has caused widespread concern around the world. To solve this problem, need concerted action
5、in all countries, both developed countries and developing countries, should make efforts for this; assume their respective responsibilities and obligations, on the basis of the principle of fair and reasonable. So it is urgent to control air pollution has reached a moment.In this passage, I use the
6、SAS software to deal with the data, which is the world's major cities air pollution of China Statistical Yearbook from 2005 to 2011, with principal component analysis. Removing the redundancy, that uses the total suspended particulate, carbon dioxide and sulfur dioxide to judge the degree of air
7、 pollution. Get the main ingredient, make it include the main information of the original indicators, become the only indicator of urban pollution. So it is convenient to know the conditions of a city's air pollution, and take some appropriate measures to control of it. Key Words:Environment pol
8、lution; Principal component analysis; Contribution rate; the environmental protection目 錄一、緒論(1)1.空氣污染的概念及危害(1)1.1空氣污染的概念(1)1.2空氣污染的危害(1)2.研究背景及意義 (6)二、空氣污染因子的概述 (7)1.二氧化碳的概念及來源 (7)2.二氧化硫的概念及來源 (7)3.懸浮顆粒的概念及來源 (8)三數(shù)據(jù)的來源與描述 (8)1.數(shù)據(jù)的來源 (8)2.數(shù)據(jù)的描述 (9)四研究方法與軟件的介紹 (9)1.研究方法的介紹 (9)1.1主成分分析的概念 (9)1.2主成分分析的基
9、本思想及原理 (9)1.3主成分分析的主要作用 (10)1.4主成分分析的計算步驟 (11)2.軟件的介紹(12)2.1 SAS的由來和發(fā)展(12)2.2 SAS在處理數(shù)據(jù)上的優(yōu)勢(12)五數(shù)據(jù)的處理(13)1. 從協(xié)方差矩陣出發(fā)對所有變量進(jìn)行主成分分析(13)2.從相關(guān)矩陣出發(fā)做主成分分析 (13)六分析與結(jié)論(17)參考文獻(xiàn)(21)致謝(21)附件(22)基于主成分分析的世界主要城市空氣污染的研究一、緒論1.空氣污染的概念及危害1.1空氣污染概念空氣污染即空氣中含有一種或多種污染物,其存在的量、性質(zhì)及時間會傷害到人類、植物及動物的生命,損害財物、或干擾舒適的生活環(huán)境,如臭味的存在。換言之,
10、只要是某一種物質(zhì)其存在的量,性質(zhì)及時間足夠?qū)θ祟惢蚱渌铩⒇斘锂a(chǎn)生影響者,我們就可以稱其為空氣污染物;而其存在造成之現(xiàn)象,就是空氣污染。換言之,某些物質(zhì)在空氣中不正常的增量就產(chǎn)生空氣污染的情形。大氣是由一定比例的氮氣、氧氣、二氧化碳、水蒸氣和固體雜質(zhì)微粒組成的混合物。就干燥空氣而言,按體積計算,在標(biāo)準(zhǔn)狀態(tài)下,氮氣占78.08%,氧氣占20.94%,稀有氣體占0.93%,二氧化碳占0.03%,而其他氣體及雜質(zhì)體積都大約是0.02%。各種自然變化往往會引起大氣成分的變化。例如,火山噴發(fā)時有大量的粉塵和二氧化碳等氣體噴射到大氣中,造成火山噴發(fā)地區(qū)煙霧彌漫,毒氣熏人;雷電等自然原因引起的森林大面積火
11、災(zāi)也會增加二氧化碳和煙粒的含量等等。一般來說,這種自然變化是局部的,短時間的。隨著現(xiàn)代工業(yè)和交通運輸?shù)陌l(fā)展,向大氣中持續(xù)排放的物質(zhì)數(shù)量越來越多,種類越來越復(fù)雜,引起大氣成分發(fā)生急劇的變化。當(dāng)大氣正常成分之外的物質(zhì)達(dá)到對人類健康、動植物生長以及氣象氣候產(chǎn)生危害的時候,我們就說大氣受了污染。按照國際標(biāo)準(zhǔn)化組織(ISO)的定義,“空氣污染(大氣污染)通常系指由于人類活動或自然過程引起某些物質(zhì)進(jìn)入大氣中,呈現(xiàn)出足夠的濃度,達(dá)到足夠的時間,并因此危害了人體的舒適、健康和福利或環(huán)境的現(xiàn)象”。1.2空氣污染的危害大氣污染的危害主要有以下幾個方面(1)危害人體人需要呼吸空氣以維持生命。一個成年人每天呼吸大約2
12、萬多次,吸入空氣達(dá)1520立方米。因此,被污染了的空氣對人體健康有直接的影響。大氣污染物對人體的危害是多方面的,主要表現(xiàn)是呼吸道疾病與生理機(jī)能障礙,以及眼鼻等粘膜組織受到刺激而患病。比如,1952年12月58日英國倫敦發(fā)生的煤煙霧事件死亡4000人。人們把這個災(zāi)難的煙霧稱為"殺人的煙霧"。據(jù)分析,這是因為那幾天倫敦?zé)o風(fēng)有霧,工廠煙囪和居民取暖排出的廢氣煙塵彌漫在倫敦市區(qū)經(jīng)久不散,煙塵最高濃度達(dá)4.46毫克/米3,二氧化硫的日平均濃度竟達(dá)到3.83毫升/米3。二氧化硫經(jīng)過某種化學(xué)反應(yīng),生成硫酸液沫附著在煙塵上或凝聚在霧滴上,隨呼吸進(jìn)入器官,使人發(fā)病或加速慢性病患者的死亡。這也
13、就是所謂的光化學(xué)污染。由上例可知,大氣中污染物的濃度很高時,會造成急性污染中毒,或使病狀惡化,甚至在幾天內(nèi)奪去幾千人的生命。其實,即使大氣中污染物濃度不高,但人體成年累月呼吸這種污染了的空氣,也會引起慢性支氣管炎、支氣管哮喘、肺氣腫及肺癌等疾病。(2)對植物的危害大氣污染物,尤其是二氧化硫、氟化物等對植物的危害是十分嚴(yán)重的。當(dāng)污染物濃度很高時,會對植物產(chǎn)生急性危害,使植物葉表面產(chǎn)生傷斑,或者直接使葉枯萎脫落;當(dāng)污染物濃度不高時,會對植物產(chǎn)生慢性危害,使植物葉片褪綠,或者表面上看不見什么危害癥狀,但植物的生理機(jī)能已受到了影響,造成植物產(chǎn)量下降,品質(zhì)變壞。(3)影響氣候大氣污染物對天氣和氣候的影響
14、是十分顯著的,可以從以下幾個方面加以說明:減少到達(dá)地面的太陽輻射量:從工廠、發(fā)電站、汽車、家庭取暖設(shè)備向大氣中排放的大量煙塵微粒,使空氣變得非常渾濁,遮擋了陽光,使得到達(dá)地面的太陽輻射量減少。據(jù)觀測統(tǒng)計,在大工業(yè)城市煙霧不散的日子里,太陽光直接照射到地面的量比沒有煙霧的日子減少近40%。大氣污染嚴(yán)重的城市,天天如此,就會導(dǎo)致人和動植物因缺乏陽光而生長發(fā)育不好。增加大氣降水量:從大工業(yè)城市排出來的微粒,其中有很多具有水氣凝結(jié)核的作用。因此,當(dāng)大氣中有其他一些降水條件與之配合的時候,就會出現(xiàn)降水天氣。在大工業(yè)城市的下風(fēng)地區(qū),降水量更多。下酸雨:有時候,從天空落下的雨水中含有硫酸。這種酸雨是大氣中的
15、污染物二氧化硫經(jīng)過氧化形成硫酸,隨自然界的降水下落形成的。硫酸雨能使大片森林和農(nóng)作物毀壞,能使紙品、紡織品、皮革制品等腐蝕破碎,能使金屬的防銹涂料變質(zhì)而降低保護(hù)作用,還會腐蝕、污染建筑物。(4)增高大氣溫度在大工業(yè)城市上空,由于有大量廢熱排放到空中,因此,近地面空氣的溫度比四周郊區(qū)要高一些。這種現(xiàn)象在氣象學(xué)中稱做“熱島效應(yīng)”。(5)對全球氣候的影響近年來,人們逐漸注意到大氣污染對全球氣候變化的影響問題。經(jīng)過研究,人們認(rèn)為在有可能引起氣候變化的各種大氣污染物質(zhì)中,二氧化碳具有重大的作用。從地球上無數(shù)煙囪和其他種種廢氣管道排放到大氣中的大量二氧化碳,約有50%留在大氣里。二氧化碳能吸收來自地面的長
16、波輻射,使近地面層空氣溫度增高,這叫做“溫室效應(yīng)”。經(jīng)粗略估算,如果大氣中二氧化碳含量增加25%,近地面氣溫可以增加0.52。如果增加100%,近地面溫度可以增高1.56。有的專家認(rèn)為,如果大氣中的二氧化碳含量照現(xiàn)在的速度增加下去,若干年后會使得南北極的冰熔化,導(dǎo)致全球的氣候異常。2.研究背景與意義 首要的問題是全球氣候變暖。近百年來全球地面溫度平均增加了0.30.6。20世紀(jì)80年代成為20世紀(jì)最熱的10a,1988年全球平均氣溫比19491979年的平均值高0.34,比20世紀(jì)初高了0.59。據(jù)政府間氣候委員會(IPCC)對全球氣候變化判斷,21世紀(jì)全球氣溫每10a將上升0.3,到2050
17、年,全球氣溫將上升1。氣候的變暖引起了海平面的上升。當(dāng)前,世界大洋溫度正以每年0.1的速度上升,全球海平面在過去的百年里平均上升了14.4cm,中國沿海的海平面也平均上升了11.5cm。目前海平面每年將上升為6mm,到2070年海平面將上升65cm,但不同海域相差較大。由溫室效應(yīng)所產(chǎn)生海平面上升的速度逐年在增加,海平面的升高將嚴(yán)重威脅低地勢島嶼和沿海地區(qū)人民的生產(chǎn)、生活和財產(chǎn)。全球氣候變暖后,世界糧食生產(chǎn)及其分布狀況會發(fā)生變化。加拿大北部和西伯利亞的永久性凍土帶將消失,使那里有可能成為世界的大糧倉;而現(xiàn)在的糧食產(chǎn)地則由于土壤濕度的降低而可能失去。同時氣溫升高使作物生長季節(jié)變暖和延長,從而使許多
18、害蟲的危害加劇。根據(jù)現(xiàn)有技術(shù)情況和糧食品種,若全球氣溫升高2,而降雨量不變的話,則糧食產(chǎn)量可能下降3%17%。氣候變暖使農(nóng)業(yè)結(jié)構(gòu)發(fā)生變化,進(jìn)而使許多農(nóng)產(chǎn)品的狀況和貿(mào)易模式也發(fā)生相應(yīng)變化。溫室效應(yīng)引起全球氣候變暖對人類環(huán)境影響還會表現(xiàn)在許多方面。其次是臭氧層較少。自1958年對臭氧層進(jìn)行觀察以來,發(fā)現(xiàn)高空臭氧層有減少的趨勢。20世紀(jì)70年代后,減少加劇,全球臭氧都呈減少趨勢,冬季減少率大于夏季。1985年英國科學(xué)家首次發(fā)現(xiàn)南極上空在910月平均臭氧含量減少50%左右,并出現(xiàn)了巨大的臭氧空洞。此后觀測到全球性平流層臭氧濃度下降;南緯3960°,減少5%10%,近赤道地區(qū)減少1.6%2.1
19、%,北緯4064°減少1.2%1.4%,并觀測到中國華南地區(qū)減少3.1%,華東、華北減少1.7%,東北地區(qū)減少3%。中國設(shè)在昆明、北京的臭氧觀測站,在19801987年間也觀測到昆明上空臭氧平均含量減少1.5%,北京減少5%??傊?,從20世紀(jì)70年代以來,全球臭氧層的損耗已是客觀存在的事實。治理空氣污染已經(jīng)到了刻不容緩的時刻,得出一個主成分,使其保留所有污染指標(biāo)的主要信息,成為衡量城市污染狀況的唯一指標(biāo),以便方便地獲得一個城市的空氣污染狀況,采取相應(yīng)的措施治理該城市的環(huán)境污染,保護(hù)人們的身體健康。二空氣污染因子的概述1.二氧化碳的概念及來源二氧化碳是一種在常溫下無色無味無臭的氣體。化
20、學(xué)式為,式量44.01,碳氧化物之一,俗名碳酸氣,也稱碳酸酐或碳酐。常溫下是一種無色無味氣體,密度比空氣略大,微溶于水,并生成碳酸。固態(tài)二氧化碳俗稱干冰,升華時可吸收大量熱,因而用作制冷劑,如人工降雨,也常在舞美中用于制造煙霧。所有含碳元素的物質(zhì)燃燒都會產(chǎn)生二氧化碳;動植呼吸也會產(chǎn)生二氧化碳;各類食質(zhì)的緩慢氧化能產(chǎn)生二氧化碳;自然界中二氧化碳礦物的開采可獲得二氧化碳。2.二氧化硫的概念及來源二氧化硫又稱亞硫酸酐,是最常見的硫氧化物,為硫酸原料氣的主要成分,是大氣主要污染物之一。無色氣體,有強烈刺激性氣味?;鹕奖l(fā)時會噴出該氣體,在許多工業(yè)過程中也會產(chǎn)生二氧化硫。由于煤和石油通常都含有硫化合物,
21、因此燃燒時會生成二氧化硫。當(dāng)二氧化硫溶于水中,會形成亞硫酸(酸雨的主要成分)。若把二氧化硫進(jìn)一步氧化,通常在催化劑如二氧化氮的存在下,便會生成硫酸。3.懸浮顆粒的概念及來源懸浮顆粒物是懸浮于大氣中的固體、液體顆粒狀物質(zhì)的總稱。大氣懸浮顆粒物的形狀、密度、粒徑大小,光、電、磁學(xué)等物理性質(zhì)及化學(xué)組成,隨其形成和來源的不同有很大差異,可分為一次顆粒物和二次顆粒物。實際大氣中的懸浮顆粒物往往是有許多不同化學(xué)組成、不同粒徑的顆粒聚集在一起的混合體。所以它沒有恒定的化學(xué)計量的組成。在城市大氣懸浮顆粒物中發(fā)現(xiàn)有幾十種金屬、非金屬元素和幾百種有機(jī)化合物。從懸浮顆粒物的來源,可分為天然來源,如土壤塵、火山灰霧、
22、海洋浪沫,一般為粗顆粒(粒徑大約1500);人為來源,如工業(yè)排放的粉塵、化石燃料燃燒的煙塵、汽車排氣中的顆粒物以及農(nóng)藥噴霧、噴氣式飛機(jī)的排放物等,顆粒的粒徑較小,一般直徑小于2。大氣中顆粒物的粒徑范圍很寬,從0.001到1000以上。三數(shù)據(jù)的來源與描述1.數(shù)據(jù)的來源分析數(shù)據(jù)來源于中國國家統(tǒng)計局發(fā)行的中國統(tǒng)計年鑒中的統(tǒng)計數(shù)據(jù)(中國統(tǒng)計年鑒參考世界銀行發(fā)行的世界發(fā)展指標(biāo)(WID),收集整理了世界主要城市空氣污染狀況統(tǒng)計表。世界發(fā)展指標(biāo)是世界銀行最重要的發(fā)展指標(biāo)匯編,數(shù)據(jù)來自得到正式認(rèn)可的國際來源。它提供現(xiàn)有的最新最準(zhǔn)確的全球發(fā)展數(shù)據(jù),包括國家、地區(qū)和全球數(shù)據(jù)的估計值。包含健康、氣候變化、公共部門、
23、環(huán)境、社會發(fā)展、科學(xué)技術(shù)、城市發(fā)展能源與礦產(chǎn)等18個專題數(shù)據(jù)。(2.數(shù)據(jù)的描述用于分析的數(shù)據(jù)集為中國統(tǒng)計年鑒中世界主要城市空氣污染狀況的統(tǒng)計數(shù)據(jù)(見附件3),包含2005-2011年世界各主要城市每年空氣污染因子中最主要的三類因子進(jìn)行了統(tǒng)計,分別是總懸浮顆粒物(微克/立方米)、二氧化碳(微克/立方米)、二氧化硫(微克/立方米)。四研究方法和軟件的介紹1.研究方法的介紹1.1主成分分析的概念主成分分析也稱主分量分析,旨在利用降維的思想,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個綜合指標(biāo)。在統(tǒng)計學(xué)中,主成分分析(principal components analysis,PCA)是一種簡化數(shù)據(jù)集的技術(shù)。它是一個線性變
24、換。這個變換把數(shù)據(jù)變換到一個新的坐標(biāo)系統(tǒng)中,使得任何數(shù)據(jù)投影的第一大方差在第一個坐標(biāo)(稱為第一主成分)上,第二大方差在第二個坐標(biāo)(第二主成分)上,依次類推。主成分分析經(jīng)常用減少數(shù)據(jù)集的維數(shù),同時保持?jǐn)?shù)據(jù)集的對方差貢獻(xiàn)最大的特征。這是通過保留低階主成分,忽略高階主成分做到的。這樣低階成分往往能夠保留住數(shù)據(jù)的最重要方面。但是,這也不是一定的,要視具體應(yīng)用而定。1.2主成分分析的基本思想及原理在實證問題研究中,為了全面、系統(tǒng)地分析問題,我們必須考慮眾多影響因素。這些涉及的因素一般稱為指標(biāo),在多元統(tǒng)計分析中也稱為變量。因為每個變量都在不同程度上反映了所研究問題的某些信息,并且指標(biāo)之間彼此有一定的相關(guān)性
25、,因而所得的統(tǒng)計數(shù)據(jù)反映的信息在一定程度上有重疊。在用統(tǒng)計方法研究多變量問題時,變量太多會增加計算量和增加分析問題的復(fù)雜性,人們希望在進(jìn)行定量分析的過程中,涉及的變量較少,得到的信息量較多。主成分分析正是適應(yīng)這一要求產(chǎn)生的,是解決這類題的理想工具。同樣,在科普效果評估的過程中也存在著這樣的問題。科普效果是很難具體量化的。在實際評估工作中,我們常常會選用幾個有代表性的綜合指標(biāo),采用打分的方法來進(jìn)行評估,故綜合指標(biāo)的選取是個重點和難點。如上所述,主成分分析法正是解決這一問題的理想工具。因為評估所涉及的眾多變量之間既然有一定的相關(guān)性,就必然存在著起支配作用的因素。根據(jù)這一點,通過對原始變量相關(guān)矩陣內(nèi)
26、部結(jié)構(gòu)的關(guān)系研究,找出影響科普效果某一要素的幾個綜合指標(biāo),使綜合指標(biāo)為原來變量的線性擬合。這樣,綜合指標(biāo)不僅保留了原始變量的主要信息,且彼此間不相關(guān),又比原始變量具有某些更優(yōu)越的性質(zhì),就使我們在研究復(fù)雜的科普效果評估問題時,容易抓住主要矛盾。上述想法可進(jìn)一步概述為:設(shè)某科普效果評估要素涉及個指標(biāo),這指標(biāo)構(gòu)成的維隨機(jī)向量為。對作正交變換,令其中為正交陣的各分量是不相關(guān)的,使得的各分量在某個評估要素中的作用容易解釋,這就使得我們有可能從主分量中選擇主要成分,削除對這一要素影響微弱的部分,通過對主分量的重點分析,達(dá)到對原始變量進(jìn)行分析的目的。各分量是原始變量線性組合,不同的分量表示原始變量之間不同的
27、影響關(guān)系。由于這些基本關(guān)系很可能與特定的作用過程相聯(lián)系,主成分分析使我們能從錯綜復(fù)雜的科普評估要素的眾多指標(biāo)中,找出一些主要成分,以便有效地利用大量統(tǒng)計數(shù)據(jù),進(jìn)行科普效果評估分析,使我們在研究科普效果評估問題中,可能得到深層次的一些啟發(fā),把科普效果評估研究引向深入。主成分分析法是一種降維的統(tǒng)計方法,它借助于一個正交變換,將其分量相關(guān)的原隨機(jī)向量轉(zhuǎn)化成其分量不相關(guān)的新隨機(jī)向量,這在代數(shù)上表現(xiàn)為將原隨機(jī)向量的協(xié)方差陣變換成對角形陣,在幾何上表現(xiàn)為將原坐標(biāo)系變換成新的正交坐標(biāo)系,使之指向樣本點散布最開的p 個正交方向,然后對多維變量系統(tǒng)進(jìn)行降維處理,使之能以一個較高的精度轉(zhuǎn)換成低維變量系統(tǒng),再通過構(gòu)
28、造適當(dāng)?shù)膬r值函數(shù),進(jìn)一步把低維系統(tǒng)轉(zhuǎn)化成一維系統(tǒng)。1.3主成分分析的主要作用主成分分析主要由以下幾個方面的作用。(1)主成分分析能降低所研究的數(shù)據(jù)空間的維數(shù)。即用研究維的空間代替維的空間(),而低維的空間代替高維的空間所損失的信息很少。即:使只有一個主成分(即1)時,這個仍是使用全部變量(個)得到的。例如要計算的均值也得使用全部的均值。在所選的前個主成分中,如果某個的系數(shù)全部近似于零的話,就可以把這個刪除,這也是一種刪除多余變量的方法。(2)有時可通過因子負(fù)荷的結(jié)論,弄清變量間的某些關(guān)系。(3)多維數(shù)據(jù)的一種圖形表示方法。我們知道當(dāng)維數(shù)大于3時便不能畫出幾何圖形,多元統(tǒng)計研究的問題大都多于3個
29、變量。要把研究的問題用圖形表示出來是不可能的。然而,經(jīng)過主成分分析后,我們可以選取前兩個主成分或其中某兩個主成分,根據(jù)主成分的得分,畫出n個樣品在二維平面上的分布況,由圖形可直觀地看出各樣品在主分量中的地位,進(jìn)而還可以對樣本進(jìn)行分類處理,可以由圖形發(fā)現(xiàn)遠(yuǎn)離大多數(shù)樣本點的離群點。(4)由主成分分析法構(gòu)造回歸模型。即把各主成分作為新自變量代替原來自變量做回歸分析。(5)用主成分分析篩選回歸變量?;貧w變量的選擇有著重的實際意義,為了使模型本身易于做結(jié)構(gòu)分析、控制和預(yù)報,好從原始變量所構(gòu)成的子集合中選擇最佳變量,構(gòu)成最佳變量集合。用主成分分析篩選變量,可以用較少的計算量來選擇量,獲得選擇最佳變量子集合
30、的效果。1.4主成分分析的計算步驟(1)原始指標(biāo)數(shù)據(jù)的標(biāo)準(zhǔn)化采集維隨機(jī)向量n個樣品,1,2,n,構(gòu)造樣本陣,對樣本陣元進(jìn)行如下標(biāo)準(zhǔn)化變換:, 其中,得標(biāo)準(zhǔn)化陣。(2)對標(biāo)準(zhǔn)化陣求相關(guān)系數(shù)矩陣其中, 。(3)解樣本相關(guān)矩陣R 的特征方程得個特征根,確定主成分,按 確定值,使信息的利用率達(dá)85%以上,對每個,解方程組得單位特征向量。(4)將標(biāo)準(zhǔn)化后的指標(biāo)變量轉(zhuǎn)換為主成分稱為第一主成分,稱為第二主成分,稱為第主成分。(5)對個主成分進(jìn)行綜合評價對個主成分進(jìn)行加權(quán)求和,即得最終評價值,權(quán)數(shù)為每個主成分的方差貢獻(xiàn)率。2.軟件的介紹2.1 SAS的由來與發(fā)展SAS (Statistic
31、al Analysia System)是當(dāng)今國際上最著名的數(shù)據(jù)分析軟件系統(tǒng),由北卡羅來納州立大學(xué)兩位生物統(tǒng)計學(xué)研究生所編寫及制定,最早祗是一個數(shù)學(xué)統(tǒng)計軟件,于1976年由Jim Goodnight及John Sall博士等人成立統(tǒng)計分析系統(tǒng)公司,并且正式推出相關(guān)軟件。經(jīng)過30多年的不斷發(fā)展與完善,已成為大型集成應(yīng)用軟件,SAS作為國際上著名的統(tǒng)計軟件之一,具有完備的數(shù)據(jù)存取、管理、分析、計算和圖形顯示功能外,還能處理大型的線形、非線形規(guī)劃問題。它廣泛應(yīng)用于政府行政管理、科研、金融等不同領(lǐng)域,在資料處理和統(tǒng)計分析領(lǐng)域,統(tǒng)計分析系統(tǒng)被譽統(tǒng)計軟件界的巨無霸。2.2 SAS在處理數(shù)據(jù)上的優(yōu)勢數(shù)據(jù)量非常
32、多,若采用傳統(tǒng)的數(shù)據(jù)處理方式,除計算量和計算難度大,要耗費極大的人力、物力之外,還要求從事環(huán)境研究保護(hù)人員具有很好的概率和數(shù)理統(tǒng)計功底。如果用SAS軟件來處理的話,就其SAS的使用者來說,只需掌握SAS的基本操作,通過編寫簡短的程序,就可以完成數(shù)據(jù)的統(tǒng)計處理。進(jìn)入Windows平臺后,SAS的主要操作就變成了可視化操作,尤其是統(tǒng)計學(xué)處理部分不需要用戶編程,就可以實現(xiàn)各種統(tǒng)計分析處理。這樣,對用戶而言,更多的時間是考慮如何進(jìn)行數(shù)據(jù)的收集和錄入等問題SAS編程簡單,界面友好,易學(xué)易用,程序處理速度快,在環(huán)境統(tǒng)計數(shù)據(jù)處理中具有很強的實效性。五數(shù)據(jù)的處理1. 從協(xié)方差矩陣出發(fā)對所有變量進(jìn)行主成分分析S
33、AS程序運行結(jié)果為:Simple Statistics 是指簡單統(tǒng)計的結(jié)果,Mean是指數(shù)據(jù)集中各變量的平均值,STD指數(shù)據(jù)集中各變量的標(biāo)準(zhǔn)化差。因此,結(jié)果顯示為總懸浮顆粒物(微克/立方米)(X1)、二氧化碳(微克/立方米)(X2)、二氧化硫(微克/立方米)(X3)的平均值分別為39.43,29.24和58.44,標(biāo)準(zhǔn)差分別為31.57,23.74和37.64。Covariance Matrix 指協(xié)方差矩陣,及總懸浮顆粒物(X1)與二氧化碳(X2)的協(xié)方差為343.60;總懸浮顆粒物(X1)與二氧化硫(X3)的協(xié)方差為58.06;二氧化碳(X2)與二氧化硫(X3)的協(xié)方差為208.51,等等
34、??偡讲睿═otal Variance)為2977.60。Eigenvalues of Covariance Matrix給出了由協(xié)方差矩陣計算出來的全部特征值(Eigenvalue)、相鄰兩個特征值的差異(difference)、每個主成分的貢獻(xiàn)率(proportion)和累積貢獻(xiàn)率(cumulative)。 即:第一主成分對方差的貢獻(xiàn)率為50.68%,第二主成分對方差的貢獻(xiàn)率為37.52%,第三主成分對方差的貢獻(xiàn)率為11.79%。第一主成分和第二主成分的累積貢獻(xiàn)率為88.21%。因此,對第三主成分以后的主成分完全可以忽略不計,用前兩個主成分就可以很好地概括這組數(shù)據(jù)Eigenvectors輸
35、出了全部特征值對應(yīng)的特征向量,它們是線性無關(guān)的單位向量。第1列表示第1主成分的得分系數(shù),第2列表示第2主成分的得分系數(shù),以此類推。 據(jù)此可以寫出由標(biāo)準(zhǔn)化變量所表達(dá)的各主成分的關(guān)系式: ,。2.從相關(guān)矩陣出發(fā)做主成分分析SAS程序運行結(jié)果為:Correlation Matrix是所有原始指標(biāo)變量之間的相關(guān)系數(shù)矩陣,即: 總懸浮顆粒物(X1)與二氧化碳(X2)之間的相關(guān)系數(shù)為0.4583;總懸浮顆粒物(X1)與二氧化硫(X3)之間的相關(guān)系數(shù)為0.0489;二氧化碳(X2)與二氧化硫(X3)之間的相關(guān)系數(shù)為0.2333。 Eigenvalues of Correlation Matrix給出了由相關(guān)
36、系數(shù)矩陣計算出來的全部特征值(Eigenvalue)、相鄰兩個特征值的差異(difference)、每個主成分的貢獻(xiàn)率(proportion)和累積貢獻(xiàn)率(cumulative)。即:第一主成分對方差的貢獻(xiàn)率為51.17%,第二主成分對方差的貢獻(xiàn)率為32.02%,第三主成分對方差的貢獻(xiàn)率為16.81%。第一主成分和第二主成分的累計貢獻(xiàn)率為83.19%。因此,對第三主成分以后的主成分完全可以忽略不計,用前兩個主成分就可以很好地概括這組數(shù)據(jù)。Eigenvectors輸出了全部特征值對應(yīng)的特征向量,它們是線性無關(guān)的單位向量。第1列表示第1主成分的得分系數(shù),第2列表示第2主成分的得分系數(shù),以此類推。
37、據(jù)此可以寫出由標(biāo)準(zhǔn)化變量所表達(dá)的各主成分的關(guān)系式:,。六分析和結(jié)論1.分析從協(xié)方差矩陣出發(fā)對所有變量進(jìn)行主成分分析和從相關(guān)矩陣出發(fā)做主成分分析兩個方向得出的結(jié)果顯示,原變量在第一主成分和第二主成分中的相對重要性由于標(biāo)準(zhǔn)化而有很大變化。從協(xié)方差矩陣出發(fā)分析所得的第一主成分中,X1,X2和X3的權(quán)重系數(shù)分別為0.310350,0.310908和0.898342,而從相關(guān)矩陣出發(fā)分析所得的第一主成分中, X1,X2和X3的權(quán)重系數(shù)分別為0.625812,0.692455和0.358978兩者差距很大,而且在第二主成分中X1,X2和X3的兩個系數(shù)相差更遠(yuǎn)。因此,由協(xié)方差矩陣和相關(guān)矩陣所得的主成分一般是
38、不相同的。在本文中,由于涉及的各變量的變化范圍差異較大,因此,應(yīng)從相關(guān)矩陣出發(fā)求主成分比較合理。因此,第一主成分是總懸浮顆粒物(X1)、二氧化碳(X2)和二氧化硫(X3)的一個加權(quán)和,當(dāng)一個城市的值較大時,可以推斷該城市總懸浮顆粒物,二氧化碳和二氧化硫的含量都較高,空氣質(zhì)量較差。反之,當(dāng)一個城市的空氣質(zhì)量較好時,所對應(yīng)的值也較小。故,第一主成分是反應(yīng)城市整體空氣質(zhì)量的綜合指標(biāo),我們一般稱它為“大小”的因子。而第二主成分的表達(dá)式中,總懸浮顆粒物(X1)和二氧化碳(X2)前的系數(shù)為負(fù),而二氧化硫(X3)前的系數(shù)為正。當(dāng)一個城市的值較大時,說明該城市的二氧化硫含量較大,而總懸浮顆粒物和二氧化碳的含量
39、較小。反之,當(dāng)一個城市的二氧化硫含量較小,總懸浮顆粒物和二氧化碳含量較大時,值也較小。2.結(jié)論利用2011年世界主要城市空氣污染狀況數(shù)據(jù),利用matlab程序(見附件4)求出各個城市的值并排序如下:城市值北京156.18天津144.82米蘭126.76墨西哥城124.82加爾各答111.22德里107.69索菲亞105.22上海103.58大丘100.87橫濱90.809釜山79.255圣保羅78.345安卡拉77.127漢城72.658孟買68.768悉尼59.731東京58.778紐約57.628馬德里55.957倫敦55.591曼谷55.3大阪55.172羅茲52.507加拉加斯52.0
40、74洛杉磯50.945開普敦48.524阿姆斯特丹47.145華沙46.973新加坡44.019芝加哥43.298曼徹斯特43.103約翰內(nèi)斯堡41.808基輔41.77巴塞羅那41.202布加勒斯特41.173多倫多37.847巴黎36.414慕尼黑34.578法蘭克福33.784布拉格33.431柏林33.062蒙特利爾31.389伯明翰29.27溫哥華29.235帕斯17.167奧克蘭16.141由排列可知,我國的北京和天津,米蘭,墨西哥城等城市空氣污染非常嚴(yán)重,建議相關(guān)部門要全方位構(gòu)筑大氣污染治理防線。首先,認(rèn)真貫徹實施大氣污染防治法,構(gòu)筑大氣污染治理法律法規(guī)防線:一是認(rèn)真貫徹實施中華
41、人民共和國大氣污染防治法及其配套實施細(xì)則; 二是強化地方政府對主要大氣污染物的減排責(zé)任,按照大氣環(huán)境質(zhì)量標(biāo)準(zhǔn),規(guī)定地方政府對削減和控制污染物排放總量負(fù)責(zé),對超過總量控制指標(biāo)的新增重點污染物排放建設(shè)項目應(yīng)當(dāng)暫停審批;三是把大氣環(huán)境質(zhì)量與制定經(jīng)濟(jì)社會發(fā)展的重大戰(zhàn)略和重大規(guī)劃相聯(lián)系,充分考慮大氣環(huán)境保護(hù)的要求; 四是加大監(jiān)控力度,要求重點排放單位必須安裝自動監(jiān)控設(shè)備,并與環(huán)保部門聯(lián)網(wǎng),嚴(yán)格禁止違法停止脫硫設(shè)施運行,以及其他違法排放行為; 五是加大違法行為處罰力度,針對常見違法行為,明確并提高罰款金額,對一些嚴(yán)重違法行為,增加限期治理、限產(chǎn)限排、停產(chǎn)整頓、關(guān)閉、治安管理處罰以至追究刑事責(zé)任等處罰手段,
42、加大處罰力度,徹底扭轉(zhuǎn)“守法成本高,違法成本低”的現(xiàn)象。其次,我們要進(jìn)一步完善大氣污染治理的管理體制機(jī)制,形成大氣污染治理各部門齊抓共管的局面。治理大氣污染是一項系統(tǒng)工程,各級黨政干部要加強領(lǐng)導(dǎo),協(xié)調(diào)各有關(guān)部門,動員全社會的力量,做好這項系統(tǒng)工程。一是環(huán)保部門要加強大氣環(huán)境保護(hù)的統(tǒng)一監(jiān)督和管理,嚴(yán)格執(zhí)法,嚴(yán)格管理; 二是建設(shè)部門要加強城市道路、供氣、供熱、綠化、環(huán)保等基礎(chǔ)設(shè)施的規(guī)劃和建設(shè),提高城市綜合防治污染的能力和水平;同時發(fā)改委等相關(guān)部門要做好項目規(guī)劃、審批等工作,要從嚴(yán)把關(guān),切實把大氣污染治理工作當(dāng)做頭等大事來抓??傊?,各部門要加強協(xié)調(diào),通力合作,齊抓共管,努力完成大氣環(huán)境治理的目標(biāo)任務(wù)
43、。最后,我們要進(jìn)一步依靠科技進(jìn)步,淘汰落后生產(chǎn)工藝和產(chǎn)能,切實提高能源效率。防治工業(yè)廢氣污染,淘汰嚴(yán)重污染環(huán)境的落后工藝和設(shè)備,采用技術(shù)起點高的清潔能源和新工藝,最大限度地減少能源和資源的浪費,從根本上減少污染物的產(chǎn)生和排放,減少末端污染治理所需要的資金投入。禁止在新建、改建、擴(kuò)建和技改項目中使用落后淘汰的生產(chǎn)工藝和設(shè)備,超過規(guī)定期限的生產(chǎn)工藝和設(shè)備要堅決取締,決不能心慈手軟,決不能姑息遷就,否則就是責(zé)任部門的失職或不作為。要進(jìn)一步加強大氣污染防治實用技術(shù)的推廣和應(yīng)用,要盡快開發(fā)推廣技術(shù)可靠、經(jīng)濟(jì)合理、配套設(shè)備過關(guān)的大氣污染防治的實用新能源、新材料、新技術(shù)。改善人們的能源消費結(jié)構(gòu),主要是逐步減
44、少直接消費煤炭,提高使用天燃?xì)夂鸵夯瘹?、電力等清潔能源的消費比例,逐步提高機(jī)動車用燃油的質(zhì)量和標(biāo)號,減少機(jī)動車尾氣的超標(biāo)排放,使大氣污染降低到最小程度,盡可能做到符合中華人民共和國大氣污染防治法的基本要求。參考文獻(xiàn)1 范金成,梅長林.數(shù)據(jù)分析.北京:科學(xué)出版社,2010年. 2 王琦. 關(guān)于改善城市大氣環(huán)境質(zhì)量的思考:齊齊哈爾大學(xué)學(xué)報,2011年.3 杜敏. 基于主成分分析法的環(huán)境質(zhì)量綜合指數(shù)研究.四川大學(xué),2006年.4胡良平.現(xiàn)代統(tǒng)計學(xué)與SAS應(yīng)用M.北京:軍事醫(yī)學(xué)科學(xué)出版社,1996.5-26.5高惠璇等.SAS系統(tǒng)SAS/STAT軟件使用手冊.北京:中國統(tǒng)計出版社,1997.6王吉利等
45、.SAS軟件與應(yīng)用系統(tǒng).北京:中國統(tǒng)計出版社,2000.7 于秀林, 任雪松編著.多元統(tǒng)計分析M.北京: 中國統(tǒng)計出版社,1999.5.8 邱東.多指標(biāo)綜合評價方法的系統(tǒng)分析.北京:統(tǒng)計出版社,19919 王曉軍.多指標(biāo)綜合評價中指標(biāo)無量綱化方法的探討.統(tǒng)計學(xué)經(jīng)濟(jì)數(shù)學(xué)方法.1993.10 于恒蘭.綜合評價的多元分析方法.統(tǒng)計研究.1993 .致 謝在論文完成之際,我首先向關(guān)心幫助和指導(dǎo)我的指導(dǎo)老師表示衷心的感謝并致以崇高的敬意!在學(xué)校的學(xué)習(xí)生活即將結(jié)束,回顧四年來的學(xué)習(xí)經(jīng)歷,面對現(xiàn)在的收獲,我感到無限欣慰。為此,我向熱心幫助過我的所有老師和同學(xué)表示由衷的感謝!在論文工作中,遇到了許許多多這樣那
46、樣的問題,有的是專業(yè)上的問題,有的是論文格式上的問題,一直得到老師的親切關(guān)懷和悉心指導(dǎo),使我的論文可以又快又好的完成,老師以其淵博的學(xué)識、嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度、求實的工作作風(fēng)和他敏捷的思維給我留下了深刻的印象,我將終生難忘我的老師對我的親切關(guān)懷和悉心指導(dǎo)。最后還要感謝我的父母,是他們一直在背后支持著我。由于我的學(xué)術(shù)水平有限,所寫論文難免有不足之處,懇請各位老師和學(xué)友批評和指正!附件附件1SAS源程序:從協(xié)方差矩陣出發(fā)對所有變量進(jìn)行主成分分析data sjwr;input x1 x2 x3;cards;(見附件2)proc princomp cov;var x1-x3;run;從相關(guān)矩陣出發(fā)做主成分分
47、析data sjwr;input x1 x2 x3;cards;(見附件2)proc princomp;var x1-x3;run;附件2程序中數(shù)據(jù)6553738090122112825051333912224411044934351868311963271001333446036816231605131203063112336554613217228193117174315104210143743741301826792997421145730438314335755391221914331014571611451818261685326312483110583916323621431410
48、711720342524662911432214511725771194512264918288111519113207453739090122126825057333913624411164934381868331963291001337446040816235605141203076112339554613217226193120174317104212143748741302026793297423145734438316335763391222114331114571811452118261985330312483410584216323821431610711920342924663
49、311432614511925771494515264919288112519133207453739090122126825057333913624411164934381868331963291001337446040816235605141203076112339554613217226193120174317104212143748741302026793297423145734438316335763391222114331114571811452118261985330312483410584216323821431610711920342924663311432614511925
50、77149451526491928811251913320735373899012212582506333 39150244112849344018683519633110013414460508162446051442030791123465546162172331931221743191042131437517413021267934974251457404383103357613912223143311145719114522182620853303124834105843163239214318107122203430246635114335145121257725945152649222881125
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中考物理復(fù)習(xí)專題5間接測量類實驗課件
- 電機(jī)與電氣控制實訓(xùn)課程教案
- Photoshop創(chuàng)意合成實例教案
- 《鯉魚風(fēng)箏》教案
- 中小學(xué)教務(wù)管理聘用協(xié)議書
- 幼兒園體弱兒關(guān)懷計劃
- 教育培訓(xùn)中心箱涵施工合同
- 臨時銷售電腦租賃合同范本
- 超市賣場租賃續(xù)約協(xié)議
- 礦產(chǎn)資源勘查單位聘用合同模板
- 2024年巴黎奧運會
- MOOC 創(chuàng)業(yè)基礎(chǔ)-暨南大學(xué) 中國大學(xué)慕課答案
- 現(xiàn)代自然科學(xué)大事年表(1894 1985)
- 典型草原割草場技術(shù)規(guī)范-編制說明-內(nèi)蒙古
- 阿壩藏族羌族自治州羌族文化生態(tài)保護(hù)實驗區(qū)實施方案 - 阿壩州羌族
- 轉(zhuǎn)體梁施工技術(shù)總結(jié)(寶蘭-陳明濤)
- 精細(xì)化工——洗滌劑的合成PPT課件
- 最新Tcpdump格式文件分析
- 大國工匠精神演講稿
- 出口退稅風(fēng)險點
- ZL10裝載機(jī)的使用說明書(共27頁)
評論
0/150
提交評論