北京市2014年天氣分析_第1頁
北京市2014年天氣分析_第2頁
北京市2014年天氣分析_第3頁
北京市2014年天氣分析_第4頁
北京市2014年天氣分析_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、摘要本文通過搜集北京市2014年全年空氣質(zhì)量等的情況數(shù)據(jù),利用SPSS、Excel等軟件對數(shù)據(jù)集進行整合及處理,共提取了包括6個空氣質(zhì)量指標(優(yōu)、良、輕度污染、中度污染、重度污染、嚴重污染)、2個溫度指標(平均溫差、平均氣溫)、6個天氣狀況指標(晴、陰、霧霾、雨、雪、多云)及3個風(fēng)力指標(小于等于3級、小于等于4級、大于4級)在內(nèi)的共計17個指標,通過描述性統(tǒng)計分析、相關(guān)分析、單因素方差分析、因子分析、聚類分析和單樣本t檢驗等六種方法對數(shù)據(jù)集進行分析得到了北京市2014年的天氣情況匯總。對于描述性統(tǒng)計分析,本文主要通過SPSS軟件處理得到北京市2014年各月的氣候情況指標的均值,方差,最大最小

2、值并借助Excel對各月的各個指標進行了合適的圖像表述,得到了北京市2014年月平均氣溫、溫差和風(fēng)力折線圖,空氣質(zhì)量狀況柱圖、各項指標的箱線圖等。對于相關(guān)分析,本文主要通過Pearson相關(guān)系數(shù)來判斷各指標間的顯著性差異,并最終認為各月份之間有一定的相關(guān)性,各空氣質(zhì)量之間也有一定的相關(guān)性,空氣質(zhì)量與其他個指標間也存在一定的相關(guān)性。對于單因素方差分析,本文利用SPSS單因素方差分析方法分別對2014年北京市6個空氣質(zhì)量指標進行單因素方差分析,研究不同空氣質(zhì)量情況之間是否有顯著性差異。結(jié)果表明在=0.05的水平下,空氣質(zhì)量天數(shù)有顯著性差異, 對于聚類分析,本文采用了系統(tǒng)聚類的方法分別將天氣狀況和空

3、氣質(zhì)量進行聚類,將12各月根據(jù)其指標觀測值進行聚類最終得到結(jié)果,并與實際情況相比較,并無太大差異。對于單樣本t檢驗,本文主要是對了空氣質(zhì)量的優(yōu)指標及天氣情況的晴指標的均值進行單樣本t檢驗,給出相應(yīng)的均值估計值,并判斷是否有顯著性差異。對于因子分析,本文主要是對空氣質(zhì)量進行因子分析,得到空氣質(zhì)量得分,在計算每月的空氣質(zhì)量的綜合得分并按照綜合得分對月份進行排名,得到月份的排名可以看出這一年中6月、5月、4月空氣質(zhì)量較好,12月和2月空氣質(zhì)量較差。關(guān)鍵詞:描述性分析 相關(guān)分析 方差分析 聚類分析 因子分析 單樣本t檢驗?zāi)夸?數(shù)據(jù)搜集整理12描述性統(tǒng)計分析22.1天氣情況的基本統(tǒng)計22.2天氣情況的圖

4、形描述22.2.1平均氣溫、溫差和風(fēng)力折線圖32.2.2空氣質(zhì)量情況柱圖32.2.3天氣情況箱線圖42.3 各季節(jié)天氣情況的統(tǒng)計分析53相關(guān)分析63.1空氣質(zhì)量與風(fēng)力、溫度、天氣指標間的相關(guān)分析63.2各月份之間的相關(guān)分析74單因素方差分析84.1單因素方差分析及其原理84.2空氣質(zhì)量的單因素方差分析95聚類分析115.1聚類分析及其原理115.2北京市空氣質(zhì)量和天氣情況的系統(tǒng)聚類116單樣本t檢驗14 6.1單樣本t檢驗原理14 6.2單樣本t檢驗結(jié)果分析147因子分析157.1因子分析的原理及步驟15 7.1.1因子分析的思想15 7.1.2因子分析的數(shù)學(xué)模型15 7.2各月綜合得分及排名

5、198結(jié)果分析21參考文獻22鍵入文字1數(shù)據(jù)搜集整理本文從北京市環(huán)保局(表1-1 基本數(shù)據(jù)表月份優(yōu)良輕度中度重度嚴重晴陰霧霾雨雪多云<=3級<=4級>4級平均溫差平均氣溫15797111421011324529.80.1252822963613922427.9-0.2351137231254208242512.19.8401395129413013234312.617.45314113004529011177712.421.86320530037010010282010.425.37396841362601429209.428.2851475004301201229209.6

6、25.8961374004101101428118.220.210594337112860424439.814.211697224126220820649.95.712111134112212024101099.6-0.7注:平均氣溫的單位是,除平均氣溫外其他指標都是使用頻數(shù)來統(tǒng)計(天數(shù)) 2描述性統(tǒng)計分析2.1天氣情況的基本統(tǒng)計如表1-1所示,可認為該數(shù)據(jù)集為7個指標的12次觀測結(jié)果。現(xiàn)將表1-1中的數(shù)據(jù)導(dǎo)入SPSS進行描述性統(tǒng)計分析,可得到每項指標觀測值對應(yīng)的最大值,最小值,均值,方差等描述數(shù)據(jù)特征的數(shù)據(jù),分析結(jié)果見表2-1.表2-1 描述統(tǒng)計量N極小值極大值均值標準差方差優(yōu)120114.

7、752.5986.750良1222011.004.43119.636輕度污染123116.582.5036.265中度污染12284.422.0214.083重度污染12041.331.3031.697嚴重污染12092.332.9648.788晴123228.675.80533.697陰12173.752.0504.205霧霾12082.332.4986.242雨120125.174.42819.606雪12030.501.0001.000多云1241410.003.51612.364<=3級12102923.175.55730.879<=4級121104.082.6106.81

8、1>4級12093.002.8608.182平均溫差127.912.610.1421.51572.297平均氣溫12-.728.213.96710.7742116.082從表2-1可以看出,平均氣溫的方差很大,說明氣溫波動幅度大,空氣質(zhì)量中良和優(yōu)的均值合計有15.75天,這說明北京平均每月只有15天左右空氣質(zhì)量較好。結(jié)合北京市的實際情況可知,北京市作為典型的北方城市,四季分明溫度變化很明顯,故與事實相符。此外,還可看出北京市在2014年內(nèi)降雪較少,天氣以晴或多云為主,其平均溫差約為10°.2.2天氣情況的圖形描述2.2.1平均氣溫、溫差和風(fēng)力折線圖將表1-1中數(shù)據(jù)導(dǎo)入Excel

9、,繪制月平均氣溫、溫差和風(fēng)力天數(shù)的折線圖,如圖2-1和圖2-2所示。圖2-1 月平均氣溫及溫差示意圖從圖2-1中可明顯看出北京市在2014年中月平均氣溫變化趨勢和平均溫差波動情況。其中,7月份平均氣溫達到28.2°為全年最高月平均氣溫,12月份平均氣溫僅為-0.7°為全年最低??梢粤私獾奖本┦屑竟?jié)變化情況大約為每年12月至次年2月為冬季,3月進入春季后氣溫回升,6月左右入夏,約7月底8月初可達到全年最高溫度,直至9月中旬入秋氣溫開始回落,以此循環(huán)。平均溫差全年無明顯變化。圖2-2 各級風(fēng)力天數(shù)示意圖從圖2-1中可明顯看出北京市在2014年中每月各級風(fēng)力天數(shù)的波動情況。其中,

10、除了5月和12月外,全年每月基本上有25天左右風(fēng)力為微風(fēng),5月只有大約15天左右風(fēng)力為微風(fēng),12月份各級風(fēng)力均為10天左右,且12月份為冬季,可以看出北京市冬季風(fēng)力較大。2.2.2空氣質(zhì)量狀況的柱圖將表1-1中數(shù)據(jù)導(dǎo)入Excel,繪制空氣質(zhì)量狀況的頻數(shù)統(tǒng)計柱圖,見圖2-3。圖2-3 空氣質(zhì)量情況頻數(shù)統(tǒng)計柱圖從圖2-3中可以看出北京市全年空氣質(zhì)量為良的天數(shù)比較多。其中,6月份空氣質(zhì)量最好,有20天左右空氣質(zhì)量為良,且沒有出現(xiàn)重度污染和嚴重污染;2月份和10月份空氣質(zhì)量較差,其中2月份有將近10天空氣質(zhì)量為嚴重污染。2.2.3天氣情況箱線圖將表1-1數(shù)據(jù)導(dǎo)入SPSS中得到箱線圖,見圖2-4。圖2-

11、4 天氣情況箱線圖從箱線圖中可清晰看出平均氣溫的變化差異最大,從中位線看出多云是主要的天氣情況,其次是晴天,空氣質(zhì)量主要為良,風(fēng)力等級主要為小于等于3級,與之前的統(tǒng)計描述一致。2.3 各季節(jié)天氣情況的統(tǒng)計分析根據(jù)北京市的實際情況,本文將1月、2月和12月劃分為冬季,3月、4月和5月為春季,6月、7月和8月為夏季,9月、10月和11月為秋季,將表1-1的原始數(shù)據(jù)集整理如表2-1所示。表2-2 各季節(jié)天氣狀況統(tǒng)計表季節(jié)優(yōu)良輕度中度重度嚴重晴陰霧霾雨雪多云<=3級<=4級>4級平均溫差平均氣溫春季838231535251471403269131512.416.3夏季11431816

12、41101622803686609.826.4秋季17311895112791019026721189.313.4冬季21202013411426916265619139.1-0.3從表2-2中可以看出,北京市夏季空氣質(zhì)量以良為主,天氣以多云和雨天為主,風(fēng)力等級幾乎全為小于等于3級,平均氣溫較為舒適。冬季污染較為嚴重,可能是因為冬季降雨及降雪太少,同時又有較大的風(fēng)。3相關(guān)分析3.1空氣質(zhì)量與風(fēng)力、溫度、天氣指標間的相關(guān)分析Pearson相關(guān)系數(shù)用來衡量兩個數(shù)據(jù)集合是否在一條線上面,它用來衡量定距變量間的線性關(guān)系。如衡量國民收入和居民儲蓄存款、身高和體重、高中成績和高考成績等變量間的線性相關(guān)關(guān)系

13、。當(dāng)兩個變量都是正態(tài)連續(xù)變量,而且兩者之間呈線性關(guān)系時,表現(xiàn)這兩個變量之間相關(guān)程度用積差相關(guān)系數(shù)。其計算公式如(3.1)式。 (3.1)其中稱為變量X的觀測數(shù)據(jù)的方差,稱為變量Y的觀測數(shù)據(jù)的方差,稱為變量X,Y的觀測數(shù)據(jù)的協(xié)方差。則根據(jù)表1-1中的數(shù)據(jù)所得Pearson相關(guān)系數(shù)見表3-1。表3-1 空氣質(zhì)量與各指標間的Pearson相關(guān)系數(shù)優(yōu)良輕度污染中度污染重度污染嚴重污染優(yōu)良輕度污染中度污染重度污染嚴重污染晴陰霧霾雨雪多云<=3級<=4級>4級平均溫差平均溫度1-.237-.521-.169-.027.059.657*-.542.112-.288.472-.587*-.5

14、38.499.477-.491-.565-.2371-.090-.030-.598*-.727*-.300.340-.608*.667*-.636*.163.192-.197-.079.443.668*-.521-.0901-.124-.344-.139-.417.066-.296.138-.018.630*.045.061-.127.158.115-.169-.030-.1241.288-.405.044.027-.246-.120-.247.448.349-.317-.204.196.182-.027-.598*-.344.2881.557.136.170.633*-.436.070-.2

15、38.080-.062-.073-.160-.134.059-.727*-.139-.405.5571.155-.120.880*-.469.491-.506-.120.055.032-.291-.509注:相關(guān)系數(shù)取Pearson相關(guān)系數(shù)從表3-1中可以知道,良與嚴重污染,霧霾與嚴重污染在0.01水平上顯著相關(guān),良與重度污染,優(yōu)與晴,霧霾與良,霧霾與重度污染,雨與良,雪與良,多云與優(yōu),多云與輕度污染,平均氣溫與良在0.05水平上顯著相關(guān)。3.2各月份之間的相關(guān)分析 則根據(jù)表1-1中的數(shù)據(jù)對各月份之間進行相關(guān)分析,見表3-2。表3-2 各月份間Pearson相關(guān)系數(shù)一月二月三月四月五月六月七月

16、八月九月十月十一月十二月一月二月三月四月五月六月七月八月九月十月十一月十二月1.810*.825*.716*.399.467.499*.519*.604*.628*.897*.584*.810*1.669*.534*.228.347.423.407.493*.647*.766*.253.825*.669*1.866*.627*.760*.746*.756*.780*.879*.905*.482.716*.534*.866*1.879*.893*.888*.895*.895*.798*.810*.234.399.228.627*.879*1.900*.836*.895*.865*.644*.57

17、8*.053.467.347.760*.893*.900*1.916*.971*.943*.778*.651*.036.499*.423.746*.888*.836*.916*1.953*.926*.770*.603*-.082.519*.407.756*.895*.895*.971*.953*1.985*.800*.647*.022.604*.493*.780*.895*.865*.943*.926*.985*1.794*.692*.077.628*.647*.879*.798*.644*.778*.770*.800*.794*1.797*.308.897*.766*.905*.810*.5

18、78*.651*.603*.647*.692*.797*1.597*.584*.253.482.234.053.036-.082.022.077.308.597*1從表3-2可以看出各月份之間的相關(guān)性比較好,除了十二月和二月外,其他月份兩兩之間都有一定的相關(guān)性,其中六月、七月、八月和九月相互之間空氣質(zhì)量及天氣情況的相似度很高。4單因素方差分析4.1單因素方差分析及其原理方差分析,又稱“變異數(shù)分析”或“F檢驗”,用于兩個及兩個以上樣本均數(shù)差別的顯著性檢驗。由于各種因素的影響,研究所得的數(shù)據(jù)呈現(xiàn)波動狀。造成波動的原因可分成兩類,一是不可控的隨機因素,另一是研究中施加的對結(jié)果形成影響的可控因素。單因

19、素方差分析模型可表示為方差分析的實質(zhì)是通過分析數(shù)據(jù)的誤差來源,進而檢驗多個總體的均值是否相同。對于一般情況,假設(shè)有k個水平,建立如下假設(shè): 不全相等每個總體系統(tǒng)內(nèi)部的誤差,主要是由隨機抽樣所引起的隨機誤差,稱為組內(nèi)誤差,組內(nèi)誤差平方和,記為SSR。各總體之間的誤差,主要是由隨機抽樣引起的隨機誤差和系統(tǒng)誤差,稱為組間誤差,組間誤差平方和記為SSE。數(shù)據(jù)總的誤差平方和記為SST。其中, 表示第i個水平的第j個觀測值,x,表示第i個水平的均值,表示n個觀測值的均值數(shù)據(jù)總的誤差主要來自兩方面,一方面是組內(nèi)誤差,另一方面是組間誤差可以證明,當(dāng)k個總體的均值相等時, 服從分子自由度為k一1,分母自由度為n

20、k的F分布,即F值越大說明在總方差中,組間方差波動越大,k個水平的均值相差越大,越有利于拒絕k個總體均值相等的假設(shè),F(xiàn)值越小,說明總方差中,組間方差波動越小,方差的波動主要是由隨機誤差引起的,越有利于接受k個總體相等的假設(shè)如果規(guī)定顯著性水平為 ,當(dāng)P值小于 時,拒絕原假設(shè),P值大于 時接受原假設(shè)。4.2空氣質(zhì)量的單因素方差分析首先對表1-1的數(shù)據(jù)進行進一步處理得到表4-1。表4-1 單因素方差分析準備表指標天數(shù)指標天數(shù)指標天數(shù)指標天數(shù)指標天數(shù)指標天數(shù)1527394751611522384252691521133475263102133945516213214311435060132203543

21、50601329364854611521437455060162133744506015293443536716293742526411121133445161注:1-優(yōu) 2-良 3-輕度污染 4-中度污染 5-重度污染 6-嚴重污染 將表4-1的數(shù)據(jù)導(dǎo)入SPSS,利用SPSS單因素方差分析方法分別對2014年北京市6個天氣指標進行單因素方差分析,研究不同空氣質(zhì)量狀況之間是否有顯著性差異。通過分析得到下結(jié)果,見表4-2、表4-3。表4-2 空氣質(zhì)量指標的方差齊性檢驗Levene 統(tǒng)計量df1df2顯著性1.928566.101表4-3 空氣質(zhì)量指標的單因素方差分析平方和df均方F顯著性組間71

22、3.2365142.64718.126.000組內(nèi)519.417667.870總數(shù)1232.65371根據(jù)表4-2,表4-3可以判斷該數(shù)據(jù)適合做單因素方差分析。從表4-2中可以看出,其P值為0.101,大于顯著性水平0.05,故不應(yīng)拒絕原假設(shè),認為6個空氣質(zhì)量的總體方差無顯著差異,滿足方差分析的前提要求;而表4-3中P值為0.00小于顯著性水平0.05,則拒絕原假設(shè),即認為6個空氣質(zhì)量指標之間存在顯著性差異。下面是各空氣質(zhì)量狀況均值差異的置信區(qū)間。表4-4各空氣質(zhì)量均值差異的置信區(qū)間(I) 指標(J) 指標均值差 (I-J)顯著性95% 置信區(qū)間下限上限3.001.001.83333.766-

23、2.09575.76232.00-4.41667*.018-8.3457-.48774.002.16667.614-1.76236.09575.005.25000*.0021.32109.17906.004.25000*.025.32108.17904.001.00-.333331.000-4.26233.59572.00-6.58333*.000-10.5123-2.65433.00-2.16667.614-6.09571.76235.003.08333.218-.84577.01236.002.08333.654-1.84576.01235.001.00-3.41667.129-7.345

24、7.51232.00-9.66667*.000-13.5957-5.73773.00-5.25000*.002-9.1790-1.32104.00-3.08333.218-7.0123.84576.00-1.00000.979-4.92902.9290注:由于表格太大,只截取指標3、4和5與其他5個指標的多重比較 通過表4-4可以得出,指標2的均值最大,指標3的均值次之,接下依次為1、4、6、5,即空氣質(zhì)量狀況中良的均值是最大的,接下來依次為輕度污染、優(yōu)、中度污染、嚴重污染、重度污染。5聚類分析5.1聚類分析概述聚類分析是通過判斷各點之間的距離來衡量各樣品的靠近程度。這些距離包括歐式距離,絕對

25、距離,馬氏距離等等。聚類的方式根據(jù)不同的要求分為快速聚類法和系統(tǒng)聚類法??焖倬垲愔饕鞘孪却_定要分類的數(shù)目,再通過初始中心到各點的距離一步步距離;系統(tǒng)聚類法首先自成一類,再根據(jù)距離而聚合最終聚為一類。本文將運用系統(tǒng)聚類的方法對數(shù)據(jù)進行處理。5.2北京市空氣質(zhì)量和天氣情況的系統(tǒng)聚類系統(tǒng)聚類的步驟一般是首先根據(jù)一批地理數(shù)據(jù)或指標找出能度量這些數(shù)據(jù)或指標之間相似程度的統(tǒng)計量;然后以統(tǒng)計量作為劃分類型的依據(jù),把一些相似程度大的站點(或樣品)首先聚合為一類,而把另一些相似程度較小的站點(或樣品)聚合為另一類,直到所有的站點(或樣品)都聚合完畢,最后根據(jù)各類之間的親疏關(guān)系,逐步畫成一張完整的分類系統(tǒng)圖,又

26、稱譜系圖。其相似程度由距離或者相似系數(shù)定義。進行類別合并的準則是使得類間差異最大,而類內(nèi)差異最小。在SPSS中,可以采用系統(tǒng)聚類法對原始數(shù)據(jù)進行聚類,進而達到將空氣質(zhì)量狀況相似的月份聚類的目的,所得聚類分析聚類過程見表5-1及結(jié)果樹狀圖5-1。表5-1空氣質(zhì)量系統(tǒng)聚類結(jié)果階群集組合系數(shù)首次出現(xiàn)階群集下一階群集 1群集 2群集 1群集 21893.0000052101121.00000734523.00000543726.00000654833.00031861342.000047711057.16762984666.5005010911278.0007010101494.00098111112

27、193.1821000圖5-1 空氣質(zhì)量系統(tǒng)聚類樹狀圖從圖表中可以看出,4、5、6、8、9月距離較近,10、11、12、1、3、7月距離較近,2月和這兩類距離較遠。較之前的統(tǒng)計描述有一點誤差,但從數(shù)據(jù)總體來看,分類還算合理。將天氣狀況相似的月份進行系統(tǒng)聚類,所得聚類分析聚類過程見表5-2及結(jié)果樹狀圖5-2。表5-2天氣情況系統(tǒng)聚類結(jié)果階群集組合系數(shù)首次出現(xiàn)階群集下一階群集 1群集 2群集 1群集 213115.0000072899.00000635611.00000445728.50030651439.00000765839.833421071347.00051881275.500709911

28、0111.00080101015164.033961111112350.2731000圖5-2天氣狀況系統(tǒng)聚類樹狀圖 從圖表中可以看出在天氣狀況的方面,1、2、3、4、10、11月距離較近,5、6、7、8、9月距離較近,12月自成一類。6單樣本t檢驗6.1單樣本t檢驗原理單樣本t檢驗的目的是利用來自某總體的樣本數(shù)據(jù),推斷總體的均值是否與指定的檢驗值之間存在顯著性差異。它是對總體均值的假設(shè)檢驗。單樣本t檢驗是指研究問題中僅涉及一個總體,且將采用t檢驗煩人方法進行分析。它的前提是樣本來自的總體應(yīng)服從或近似服從正態(tài)分布。單樣本t檢驗作為假設(shè)檢驗的一種方法,其基本步驟與假設(shè)檢驗是完全相同的。檢驗步驟:

29、1提出原假設(shè)2選擇檢驗統(tǒng)計量3.計算檢驗統(tǒng)計量觀察值和概率P-值4.給定顯著性水平,并作出決策6.2單樣本t檢驗結(jié)果分析利用SPSS對空氣質(zhì)量狀況及天氣情況的指標進行單樣本t檢驗,結(jié)果如下表。表6-1優(yōu)指標的單樣本t檢驗檢驗值 = 5tdfSig.(雙側(cè))均值差值差分的 95% 置信區(qū)間下限上限優(yōu)-.33311.745-.250-1.901.40 表6-2晴指標的單樣本t檢驗檢驗值 = 9 tdfSig.(雙側(cè))均值差值差分的 95% 置信區(qū)間下限上限晴-.19911.846-.333-4.023.35 從表6-1中可以看出它的P值為0.745,大于給定的顯著性水平,可以認為檢驗值與優(yōu)的均值無

30、顯著性差異,即5是優(yōu)指標的均值估計。95%的置信區(qū)間告訴我們有95%的把握認為優(yōu)指標的均值在3.16.4之間。從表6-2中可以看出晴指標t檢驗的P值為0.846,大于給定的顯著性水平,可以認為檢驗于晴的均值無顯著性差異。95%的置信區(qū)間告訴我們有95%的把握認為晴指標的均值在4.9812.35之間。7因子分析7.1因子分析的原理及步驟7.11因子分析的思想因子分析的基本思想是通過變量(或樣品)的相關(guān)系數(shù)矩陣(對樣品是相似系數(shù)矩陣)內(nèi)部結(jié)構(gòu)的研究,找出能控制所有變量(或樣品)的少數(shù)幾個隨機變量去描述多個變量(或樣品)之間的相關(guān)(相似)關(guān)系,但在這里,這少數(shù)幾個隨機變量是不可觀測的,通常稱為因子。

31、然后根據(jù)相關(guān)性(或相似性)的大小把變量(或樣品)分組,使得同組內(nèi)的變量(或樣品)之間相關(guān)性(或相似性)較高,但不同組的變量相關(guān)性(或相似性)較低。7.1.2因子分析的數(shù)學(xué)模型數(shù)學(xué)模型(正交因子模型)R型因子分析數(shù)學(xué)模型用矩陣表示:簡記為且滿足:1)ii) 即F和是不相關(guān)的;iii)即F1Fm不相關(guān)且方差皆為1。即不相關(guān),且方差不同。其中是可實測的p個指標所構(gòu)成p維隨機向量,是不可觀測的向量,F(xiàn)稱為X的公共因子或潛因子,即前面所說的綜合變量,可以把它們理解為在高維空間中的互相垂直的m個坐標軸;aij稱為因子載荷是第i個變量在第j個公共因子上的負荷,如果把變量Xi看成m維因子空間中的一個向量,則表

32、示Xi在坐標軸Fj上的投影,矩陣A稱為因子載荷矩陣;稱為X的特殊因子,通常理論上要求的協(xié)方差陣是對角陣,中包括了隨機誤差。Q型因子分析數(shù)學(xué)模型為:此時X1, X2, , Xn表示n個樣品。因子分析的目的就是通過模型代替X,由于,從而達到簡化變量維數(shù)的愿望。因子模型中公共因子、因子載荷和變量共同度的統(tǒng)計意義為了便于對因子分析計算結(jié)果做解釋,將因子分析數(shù)學(xué)模型中各個量的統(tǒng)計意義加以說明。假定因子模型中,各個變量以及公共因子、特殊因子都已經(jīng)是標準化(均值為0,方差為1)的變量。(1)因子載荷的統(tǒng)計意義已知模型:兩端后乘Fj得:于是由于在標準化下有:因此所以上式可寫成:(因為各因子不相關(guān),所以相關(guān)系數(shù)

33、為0)故因子載荷的統(tǒng)計意義就是第i個變量與第j個公共因子的相關(guān)系數(shù)即表示Xi依賴Fj的份量(比重)。(2)變量共同度的統(tǒng)計意義所謂變量Xi的共同度定義為因子載荷陣A中第i行元素的平方和,即為了說明它的統(tǒng)計意義,將下式兩邊求方差,即V由于Xi已標準化了,所以有此式說明變量Xi的方差由兩部分組成:第一部分為共同度,它刻劃全部公共因子對變量Xi的總方差所作的貢獻,越接近1,說明該變量的幾乎全部原始信息都被所選取的公共因子說明了。當(dāng)時,說明公共因子對Xi影響很小,主要由特殊因子來描述。第二部分是特定變量所產(chǎn)生的方差,稱為特殊因子方差僅與變量Xi本身的變化有關(guān),它是使Xi的方差為1的補充值。(3)公因子

34、Fj的方差貢獻的統(tǒng)計意義將因子載荷矩陣中各列元素的平方和記為稱Sj為公共因子Fj對X的貢獻,即Sj表示同一公共因子Fj對諸變量所提供的方差貢獻之總和,它是衡量公共因子相對重要性指標。因子旋轉(zhuǎn)因子旋轉(zhuǎn)的目的不僅要找出公共因子以及對變量進行分組,更重要的是要知道每個公共因子的意義,以便對實際問題作出科學(xué)的分析。m個因子,每次取兩個全部配對進行旋轉(zhuǎn),共需旋轉(zhuǎn)次,算做一個循環(huán)完畢,如果循環(huán)完畢得出的因子載荷陣還沒有達到目的,則可以繼續(xù)進行第二輪次配對旋轉(zhuǎn),在實際應(yīng)用中,經(jīng)過若干次旋轉(zhuǎn)之后,若相對方差改變不大,則停止旋轉(zhuǎn),最后得即為旋轉(zhuǎn)后的因子載荷矩陣。 因子得分因子分析的數(shù)學(xué)模型是將變量(或樣品)表示

35、為公共因子的線性組合:由于公共因子能反映原始變量的相關(guān)關(guān)系,用公共因子代表原始變量時,有時更有利于描述研究對象的特征,因而往往需要反過來將公共因子表示為變量(或樣品)的線性組合,即稱上式為因子得分的函數(shù)。用它來計算每個樣品的公共因子得分。由于因子得分函數(shù)中方程的個數(shù)m小于變量的個數(shù)p,因此不能精確計算出因子得分,只能對因子得分進行估計。假設(shè)公共因子可以對p個變量作回歸,對變量的回歸方程為由于假設(shè)變量及公共因子都已經(jīng)標準化了,所以。則于是其中這就是估計因子得分的計算公式。7.2各月綜合得分及排名將空氣質(zhì)量劃分等級得分:優(yōu)-5分、良-4分、輕度污染-3分、中度污染-2分、重度污染-1分、嚴重污染-

36、0分。得到空氣質(zhì)量得分,再算綜合得分,依據(jù)綜合得分對月份進行排名。表7-1 因子解釋的總方差表成份初始特征值提取平方和載入旋轉(zhuǎn)平方和載入合計方差的 %累積 %合計方差的 %累積 %合計方差的 %累積 %12.34839.13839.1382.34839.13839.1382.25437.56637.56621.44824.13563.2731.44824.13563.2731.53725.62263.18831.35322.54485.8161.35322.54485.8161.35822.62885.8164.67911.32197.1375.1672.79099.9286.004.0721

37、00.000從表7-1可以看出,前三個因子的方差累計貢獻率達到了85.816%。因此,可提取3個因子,3個因子共解釋了原有變量總方差的85.816%,總體上,原有變量的信息丟失量較少,因子分析效果較理想。表7-2 旋轉(zhuǎn)后的因子載荷矩陣成份123優(yōu).043.854-.253良-.898-.007.026輕度污染-.071-.884-.240中度污染-.069-.027.953重度污染.799.148.465嚴重污染.893.057-.335 根據(jù)該表可寫出因子分析模型: 優(yōu)=0.043f1+0.854f2-0.253f3 良=-0.898f1-0.007f2+0.026f3 輕度污染=-0.07

38、1f1-0.884f2-0.240f3 中度污染=-0.069f1-0.027f2+0.953f3 重度污染=0.799f1+0.148f2+0.465f3 嚴重污染=0.893f1+0.057f2-0.335f3另外,通過該表我們可以看出:第1個因子主要解釋了良、重度污染和嚴重污染,可命名為空氣質(zhì)量差;第2個因子主要解釋了優(yōu)和輕度污染,可命名為空氣質(zhì)量優(yōu);第3個因子主要解釋了中度污染,可命名為空氣質(zhì)量良。表7-3 因子得分系數(shù)矩陣成份123優(yōu)-.051.567-.195良-.407.069.015輕度污染.039-.580-.168中度污染-.025-.022.702重度污染.353.028

39、.344嚴重污染.399-.032-.243 根據(jù)該表可以寫出因子得分函數(shù): F1=-0.051優(yōu)-0.407良+0.039輕度-0.025中度+0.353重度+0.399嚴重 F2=0.567優(yōu)+0.069良-0.580輕度-0.022中度+0.028重度-0.032嚴重 F3=-0.195優(yōu)+0.015良-0.168輕度+0.702中度+0.344重度-0.243嚴重 根據(jù)以上幾個表,我們可以計算出綜合得分,得出各月空氣質(zhì)量的排名,結(jié)果如下表。表7-4 各月份綜合得分及排名月份第一因子第二因子第三因子綜合得分排名1-11.6150.1671.181-4.24472-2.9890.775-5.291-2.175123-18.47611.7394.789-3.317104-20.108-15.7833.608-10.86335-22.42-6.90

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論