一組空氣污染數(shù)據(jù)的主成分分析_第1頁(yè)
一組空氣污染數(shù)據(jù)的主成分分析_第2頁(yè)
一組空氣污染數(shù)據(jù)的主成分分析_第3頁(yè)
一組空氣污染數(shù)據(jù)的主成分分析_第4頁(yè)
一組空氣污染數(shù)據(jù)的主成分分析_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

t精心整理t一組空污數(shù)據(jù)的成分析【說(shuō)明面的多元統(tǒng)計(jì)分析練習(xí)題摘自等編寫(xiě)用多元統(tǒng)計(jì)分五版原書(shū)為:RichardA.JohnsonandDeanW.Wichern.Ed).PearsonEducation,Inc.2003。我看的是中國(guó)統(tǒng)計(jì)出版社()2003年發(fā)行的影印本。第一題為原書(shū)第1.6題,即第章的第題,第二題為原書(shū)第題,即第8章的第12。第二題用的是第一題的數(shù)據(jù)。1題1.6.ThedatainTable1.5are42measurementsonair-pollutionvariablesrecordedat12:00noonintheLos(a)(b)Constructthex,,andRarrays,andinterprettheentriesin.nTABLE1.5Solarradiation(Wind()x)x))NO(x)()HC(x)12353678987212871073957103356108828156914281089052121298474121557264211478251111186452139671541036914212777274181010702117107218109774191087641738715316496742132969339310623144988427388042131153033536835110238843273

精心整理686108756108557768

78796237715248753585868679796840

4243446444377564

2131115111124223

1179710128106961398116

111082784249101218256145

3333343322223232SourceConsidertheair-pollutiondatalistedinTable1.5.Yourjobistosummarizethesedatainfewerthan=7dimensSandthecorrelabesummarizedinthreeorfewerdimensions?Canyouinterprettheprincipalcomponents?2部分答2.1部分計(jì)參數(shù)利用Excel計(jì)算的平均值(x)和標(biāo)準(zhǔn)差SolarradiationNOO2

HC73.8571434.54761910.047619Stdev1.581138817.3353881.23372093.3709837Excel給出的協(xié)方差矩陣SolarradiationNO22.4404762CO-0.369048NO-0.452381NO23Excel給出相關(guān)系數(shù)矩陣RNONOOHC23CO0.18279341NO

1

精心整理NO0.296898112-0.1339520.166642230.23470430.44776780.15445061從相關(guān)系數(shù)矩陣可以看出,CO與NO、相關(guān)性明顯,O與Solarradiation、CO相關(guān)性明2顯。后面的主成分分析將CO與NO、歸并到一個(gè)主成分,將O與歸并到一個(gè)23主成分,Wind歸并到一個(gè)主成分與的相關(guān)系數(shù)并不高,但從正相關(guān)的角度看,二者的數(shù)值倒是最高的。方差極大正交旋轉(zhuǎn)之后,HC與CO、、歸并到一個(gè)因子,因?yàn)?與的相關(guān)系數(shù)較高,與、的相關(guān)系數(shù)高于其他變量。22.2主成分析之——數(shù)據(jù)未標(biāo)準(zhǔn)化下面是從相關(guān)矩陣R出發(fā),給出的結(jié)果。原始數(shù)據(jù)未經(jīng)標(biāo)準(zhǔn)化。所謂從出發(fā),就是在—選項(xiàng)中選中CorrelationMatrix。出的相關(guān)系數(shù)矩陣(CorrelationMatrix),與Excel計(jì)的結(jié)果一樣。公因子方差(Communalities)表如下。公因子方差變化~0.795之間,相差不是很大。但是,公因子方差值沒(méi)有達(dá)到以上的,可見(jiàn)每一個(gè)變量體現(xiàn)在三個(gè)主成分中的信息都不超過(guò)。特征根與方差貢獻(xiàn)(TotalVarianceExplained如下表??梢?jiàn)提取三個(gè)主成分可以解釋原7格變量的主成分載荷矩陣()見(jiàn)下表。將上表從中復(fù)制到中,進(jìn)行涂色分類,結(jié)果如下表所示。Component13-0.362020.31424-0.619970.24631CO0.842417-0.00803-0.12466NO0.511736NO0.2351830.215682230.4882570.593692主成分分類如下:第一主成分的主要相關(guān)變量:CO、NO、NO。2第二主成分的主要相關(guān)變量:Solarradiation、。3第三主成分的主要相關(guān)變量:、HC在主成分載荷圖(ComponentPlot)中,三個(gè)變量分別落入三個(gè)不同的主成分代表的區(qū)域。主成分得分表如下最后一欄對(duì)幾個(gè)典型的樣本給出了簡(jiǎn)單的解釋注意解釋的時(shí)候看主成分載荷矩陣中載荷值的正負(fù)號(hào)。Casesf1f2f3

典型的說(shuō)明S1-0.8186S2-0.36015S3S40.2425樣本4代表的區(qū)域Wind、染嚴(yán)重S5-0.4042S6-0.192781.21954S7S8

樣本78表的區(qū)域與、NO、2-0.34124污染有明顯的關(guān)系

精心整理S9S10S11S12S13S14S15S16S17S18S19S20S21

-0.50662-0.89378-0.66037-0.87787-0.42935-0.751

-0.81736-0.45848-0.17036-0.39862-0.3635

-1.48345-0.27016-0.66029

樣本21表的區(qū)域Solarradiation、O污染3較小S22S23S24S25S26S27S28S29S30S31S32S33S34S35S36S37

-0.69373-1.16263-0.91899-1.32458-0.10472-1.8593-0.62672-0.14264-1.71429-0.80238-1.00653

-0.09747-1.70335-0.13915-0.51948-0.6911-0.08347-1.95681-1.13269-1.92662

-2.12097-0.37202-1.08681-2.63096樣本33表的區(qū)域Wind、HC污染較小-0.08554-0.0517-1.17569樣本和代表的區(qū)域、S38S39S40S41S42

-0.48079-1.17776

-1.77265-1.04272-0.49683-0.53042

-1.32357-0.66334-1.07633-0.57934-1.55538

污染嚴(yán)重32.3主成分析之——數(shù)據(jù)未標(biāo)準(zhǔn)化下面是從協(xié)方差矩陣S發(fā),給出的結(jié)果。原始數(shù)據(jù)未經(jīng)標(biāo)準(zhǔn)化。所謂從S發(fā),就是在FactorAnalysis:Extraction—選項(xiàng)中選中CovarianceMatrix。公因子方差()表如下。在未經(jīng)處理的)公因子方差一欄,數(shù)值都是原始數(shù)據(jù)的方差。不過(guò)與前面給出的協(xié)方差矩陣有所不同,Excel給出的是總體方差,給的是抽樣方差。例如以的Initial為例,2.4404762×,或者2.5(對(duì)照前面的協(xié)方差矩陣)。重標(biāo)的()結(jié)果是Extraction值與Initial之比。公因子方差的合計(jì)結(jié)果如下:

精心整理RescaledExtractionExtraction1300.51568300.1336710.9987288CO1.52206740.060166610.0395295NO1.18234610.006750210.00570913.84594280.478513410.0034839合計(jì)特征根與方差貢獻(xiàn)()如下表。在一欄中顯示,提取一個(gè)主成分似乎可以解釋原來(lái)7變量的但重標(biāo)之后顯示的數(shù)值卻是17.137%。根據(jù)公因子方差表和合計(jì)結(jié)果,重標(biāo)之前,全部的方差解釋為304.25786/348.54065*100=87.295%;重標(biāo)之后,全部的方差解釋為=17.137%。主成分載荷矩(ComponentMatrix見(jiàn)下表可以看來(lái)由于變量的方差很大,它絕對(duì)地控制了第一主成分。2.4主成分析之——數(shù)據(jù)經(jīng)標(biāo)準(zhǔn)化下面是從協(xié)方差矩陣S發(fā),SPSS給出的結(jié)果。原始數(shù)據(jù)經(jīng)過(guò)標(biāo)準(zhǔn)化??梢缘剿械慕Y(jié)果重標(biāo)前后一樣,并且與從相關(guān)矩陣出發(fā)計(jì)算的結(jié)果一樣。公因子方差(Communalities)表如下,重標(biāo)前后的結(jié)果一樣。特征根與方差貢獻(xiàn)(TotalVarianceExplained)如下表。重標(biāo)前后結(jié)果一樣。主成分載荷矩陣(ComponentMatrix)見(jiàn)下表,重標(biāo)前后一樣??梢钥吹剑谝恢鞒煞值南鄬?duì)重要性受到標(biāo)準(zhǔn)化的極大影響結(jié)論自然是如果在極其不同的范圍內(nèi)測(cè)量變量或者測(cè)量單位的量綱不同,變量必須經(jīng)過(guò)標(biāo)準(zhǔn)化。否則,應(yīng)該從相關(guān)系數(shù)矩陣出發(fā)開(kāi)展主成分分析。2.5因子析——差極大旋轉(zhuǎn)數(shù)據(jù)經(jīng)過(guò)標(biāo)準(zhǔn)化,從任意矩陣出發(fā),在因子分析中進(jìn)行方差極大旋轉(zhuǎn)(Varimax),載荷矩陣如下。載荷矩陣和因子分類結(jié)果如下表。Component

公因子方1差0.73707030.04301990.7359707-0.0167460.543784CO0.7252709NO-0.38278-0.4816890.79463070.1

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論