模糊主成分分析的改進(jìn)

上傳人：1*** IP屬地：廣東上傳時(shí)間：2023-11-20 格式：DOCX 頁(yè)數(shù)：6 大?。?0.86KB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩1頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

模糊主成分分析的改進(jìn)

經(jīng)典的多元分析方法1933年，主成分分析首次提出。主成分分析是利用降維的思想,在損失很少信息的前提下把多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)綜合指標(biāo)的多元統(tǒng)計(jì)方法。通常把轉(zhuǎn)化生成的綜合指標(biāo)稱之為主成分,其中每個(gè)主成分都是原始變量的線性組合,且各個(gè)主成分之間互不相關(guān),這就使得主成分比原始變量具有某些更優(yōu)越的性能。這樣在研究復(fù)雜問(wèn)題時(shí)就可以只考慮少數(shù)幾個(gè)主成分而不至于損失太多信息,從而更容易抓住主要矛盾,揭示事物內(nèi)部變量之間的規(guī)律性,同時(shí)使問(wèn)題得到簡(jiǎn)化,提高分析效率。經(jīng)典主成分分析與其它的多元統(tǒng)計(jì)分析方法一樣,它對(duì)極端值及缺失值非常的敏感,而極端值與缺失數(shù)據(jù)會(huì)帶來(lái)殘缺或錯(cuò)誤的分析結(jié)果。因此,有必要提出一些有效的方法來(lái)減少極端值的影響。眾所周知,決策是一個(gè)非常復(fù)雜而繁瑣的過(guò)程,在這個(gè)過(guò)程中或多或少都會(huì)受到客觀條件的影響,而客觀條件又具有不確定的因素,因此,每個(gè)決策都具有一定的風(fēng)險(xiǎn)性。目前的多數(shù)決策都是在目標(biāo)、約束條件和一系列行動(dòng)還沒(méi)有準(zhǔn)確確定的環(huán)境下進(jìn)行的,模糊集合理論為解決這類問(wèn)題提供了其他理論所不能勝任的數(shù)學(xué)工具,近年來(lái),把模糊數(shù)學(xué)的知識(shí)應(yīng)用到?jīng)Q策分析中,使模糊集參與決策,建立相應(yīng)的模糊決策模型,使計(jì)算機(jī)的決策支持程度得到提高,正逐步形成一個(gè)完整的、完備的系統(tǒng)模糊決策支持理論體系。同時(shí),由于傳統(tǒng)的模糊決策模型大都基于最大范式和最小范式,使決策過(guò)程中人為參與過(guò)多,這樣無(wú)形中增加了主觀任意性,導(dǎo)致決策結(jié)果很難把握。所以,針對(duì)經(jīng)典主成分分析的缺點(diǎn)本文提出了模糊數(shù)學(xué)期望、模糊方差、模糊協(xié)方差及模糊相關(guān)系數(shù)的概念,并將其引入經(jīng)典主成分分析中,來(lái)更有效的改進(jìn)經(jīng)典主成分分析,從而提出了模糊主成分分析。1隨機(jī)變量的數(shù)字特征在隨機(jī)變量的研究中,常常需要去研究與隨機(jī)變量有關(guān)的某些特殊的統(tǒng)計(jì)數(shù)據(jù),這種統(tǒng)計(jì)數(shù)據(jù)雖然不能完整地描述隨機(jī)變量的性質(zhì),但它能反映隨機(jī)變量在某些方面的重要特征。我們把它們叫做隨機(jī)變量的“數(shù)字特征”。此外,有些常用的隨機(jī)變量,只要知道了隨機(jī)變量的某幾個(gè)數(shù)字特征,就可以求得其概率分布。因此隨機(jī)變量的數(shù)字特征在理論研究和實(shí)際應(yīng)用上都具有重要意義。統(tǒng)計(jì)學(xué)研究的目的,就是要獲取隨機(jī)變量或?qū)崪y(cè)數(shù)據(jù)的某些統(tǒng)計(jì)特征,根據(jù)統(tǒng)計(jì)特征,尋求統(tǒng)計(jì)規(guī)律。因此,需要從統(tǒng)計(jì)特征著手,研究各種統(tǒng)計(jì)方法。在這些數(shù)字特征中,最為常用的是數(shù)學(xué)期望、方差、協(xié)方差和相關(guān)系數(shù)。下面我們將分別予以討論。1.1模糊均值的獲取設(shè)集合X={x1,x2,…,xn},隸屬度N={μ1,μ2,…,μn}。相應(yīng)的模糊集合:F={X,N}={x1μ1,x2μ2,…,xnμn},則稱FE(F)=n∑k=1xkμkn∑k=1μk(1)為X的模糊數(shù)學(xué)期望,或模糊均值。在實(shí)際應(yīng)用中,模糊均值不能直接計(jì)算,而是利用模糊迭代方法獲取。設(shè)實(shí)測(cè)數(shù)據(jù)X={x1,x2,…,xn},隸屬度N={μ1,μ2,…,μn},其模糊均值為?x=n∑k=1xkμkn∑k=1μk(2)其中:μk(t)={1t=0e-|xk-¨x(t)|α0＜t≤m(k=1?2???n)隸屬度的初值μk(0)=1,不難看出,模糊均值的初值?x=ˉx。m為模糊迭代次數(shù),取決于對(duì)迭代精度的具體要求。α=1nn∑k=1|xk-?x(t)|1.2模糊離差的計(jì)算設(shè)集合X={x1,x2,…,xn},模糊數(shù)學(xué)期望xD={d1?d2???dn}?={|x1-?x|?|x2-?x|???|xn-?x|},隸屬度N={μ1,μ2,…,μn},則稱FD(D)=n∑k=1dkμkn∑k=1μk(3)為X的模糊離差。在實(shí)際應(yīng)用中,模糊離差不能直接計(jì)算,而是利用模糊迭代方法獲取。設(shè)實(shí)測(cè)數(shù)據(jù)X={x1,x2,…,xn},模糊數(shù)學(xué)期望xD={d1?d2???dn}?={|x1-?x|?|x2-?x|???|xn-?x|},隸屬度N={μ1,μ2,…,μn},其模糊離差為?d=n∑k=1dkμkn∑k=1μk(4)其中:μk(t)={1t=0e-|dk-?d(t)|α0＜t≤m(k=1?2???n)m為模糊迭代次數(shù),取決于對(duì)迭代精度的具體要求。α=1nn∑k=1|dk-?d(t)|。1.3x的模糊均方差及模糊標(biāo)準(zhǔn)差設(shè)集合X={x1,x2,…,xn},模糊數(shù)學(xué)期望xD={d1?d2???dn}?={|x1-?x|?|x2-?x|???|xn-?x|},隸屬度Ν={μ1?μ2???μn}??D={?d1??d2????dn}?{d1μ1?d2μ2???dnμn}?則稱FV(?D)=1nn∑k=1?d2k(5)為X的模糊方差,另記為fσ2X,稱fσX=√FV(～D)為X的模糊均方差或模糊標(biāo)準(zhǔn)差。1.4x1fvd12={(x11,x12),(x21,x22),…,(xn1,xn2)}隸屬度分別為Ν=(Ν1?Ν2)={(μ11?μ12)?(μ21?μ22)???(μn1?μn2)}??D=(?D1??D2)={(?d11??d12)?(?d21??d22)???(?dn1??dn2)}?={(d11?μ11?d12?μ12)?(d21?μ21?d22?μ22)}…,(dn1,μn1,dn2,μn2)則稱FCov(?D1??D2)=1nn∑i=1?dn1?dn2(6)為X1與X2的模糊協(xié)方差。通常記作fσ12。對(duì)于n元變量X=(X1,X2,…,Xn),各分量之間存在模糊協(xié)方差關(guān)系。記fσij=1nn∑i=1?dni?dnji?j=1?2???n,顯然,當(dāng)i≠j時(shí),fσij表示第i個(gè)分量與第j個(gè)分量的模糊協(xié)方差;當(dāng)i=j時(shí),fσii就代表第i個(gè)分量的模糊方差。記作FΣ=[fσ11fσ12?fσ1nfσ21fσ22?fσ2n????fσn1fσn2?fσnn]上式稱為n元變量X的模糊協(xié)方差矩陣。由此,模糊方差FV(?D1)＞0?FV(?D2)＞0。則稱fρ12(X1?X2)=FCov(?D1??D2)√FC(～D1)FV(～D2)(7)為X1與X2的模糊相關(guān)系數(shù)或模糊標(biāo)準(zhǔn)協(xié)方差。對(duì)于n元隨機(jī)變量X=(X1,X2,…,Xn),與之對(duì)應(yīng)的模糊相關(guān)系數(shù)矩陣記作FΡ=[fρ11fρ12?fρ1nfρ21fρ22?fρ2n????fρn1fρn2?fρnn]2主要成分的模糊分析2.1ffk線性組合假設(shè)我們所討論的實(shí)際問(wèn)題中,有p個(gè)指標(biāo),我們把這p個(gè)指標(biāo)看作p個(gè)隨機(jī)變量,記為X1,X2,…,Xp,模糊主成分分析就是要把這p個(gè)指標(biāo)的問(wèn)題,轉(zhuǎn)變?yōu)橛懻損個(gè)指標(biāo)的線性組合的問(wèn)題,而這些新的指標(biāo)FF1,FF2,…,FFk(k≤p),按照保留主要信息量的原則充分反映原指標(biāo)的信息,并且相互獨(dú)立。這種由討論多個(gè)指標(biāo)降為少數(shù)幾個(gè)綜合指標(biāo)的過(guò)程在數(shù)學(xué)上就叫做降維。模糊主成分分析通常的做法是,尋求原指標(biāo)的線性組合FF1。FF1=u11X1+u21X2+?+up1XpFF2=u12X1+u22X2+?+up2Xp?FFp=u1pX1+u2pX2+?+uppXp它應(yīng)滿足如下的條件:每個(gè)模糊主成分的系數(shù)平方和為1,即u21i+u22i+…+u2pi=1模糊主成分之間相互獨(dú)立,即無(wú)重疊的信息,即Cov(FFi,FFj)=0,i≠ji,j=1,2,…,p模糊主成分的方差依次遞減,重要性依次遞減,即Var(FF1)≥Var(FF2)≥…≥Var(FFp)2.2模糊主成分的計(jì)算在實(shí)際問(wèn)題中,X的模糊協(xié)方差陣與模糊相關(guān)陣通常是未知的。于是需要通過(guò)樣本數(shù)據(jù)來(lái)估計(jì)。設(shè)有n個(gè)樣本,每個(gè)樣本有p個(gè)指標(biāo),這樣共得到np個(gè)數(shù)據(jù),原始數(shù)據(jù)矩陣如下:X=[x11x12?x1px21x22?x2p???xn1xn2?xnp]第一步:由X的模糊樣本協(xié)方差陣fσki,求出其特征根,即解方程|FΣ-λI|=0,可得特征根:λ1≥λ2≥…≥λp≥0第二步:求出分別所對(duì)應(yīng)的特征向量,U1,U2,…,UpUi=(u1i,u2i,…,upi)T第三步:計(jì)算累積貢獻(xiàn)率,給出恰當(dāng)?shù)闹鞒煞謧€(gè)數(shù)。k∑i=1λi/p∑i=1λi第四步:計(jì)算所選出的k個(gè)模糊主成分。FFi=UTiX,i=1,2,…,k(k≤p)我們進(jìn)行模糊主成分分析的目的之一是希望用盡可能少的模糊主成分FF1,FF2,…,FFk(k≤p)代替原來(lái)的p個(gè)指標(biāo)。到底應(yīng)該選擇多少個(gè)主成分,在實(shí)際工作中,主成分個(gè)數(shù)的多少取決于能夠反映原來(lái)變量80%以上的信息量為依據(jù),即當(dāng)累積貢獻(xiàn)率≥80%時(shí)的主成分的個(gè)數(shù)就足夠了。最常見(jiàn)的情況是主成分為2到3個(gè),并在各主成分中提取因子負(fù)荷絕對(duì)值相對(duì)較大的基因或樣品進(jìn)行進(jìn)一步分析,合理解釋其生物含義,實(shí)現(xiàn)研究目的。如果變量有不同的量綱,則應(yīng)該基于相關(guān)系數(shù)矩陣進(jìn)行主成分分析,分析步驟同上。3系統(tǒng)完成3.1模型的相似性模型的狀態(tài)圖如圖1所示。3.2模糊相關(guān)函數(shù)模型的類描述圖如圖2所示。其中,number為原始數(shù)據(jù)總數(shù),member為原始數(shù)據(jù)維數(shù),sample[,]為原始數(shù)據(jù)矩陣。通過(guò)函數(shù)Mean()和GetGMOfMean()分別計(jì)算出模糊均值mean模糊均值隸屬度gmOfMean[,],由函數(shù)MeanOfDeviation()和GetGMOfDeviation()分別計(jì)算出模糊離差均值meanOfDeviation[,]與模糊離差均值隸屬度gmOfDeviation[,],然后由函數(shù)Variance()、Covariance()與Correlation()分別計(jì)算出模糊方差variance模糊協(xié)方差covariance[,]和模糊相關(guān)系數(shù)correlation[,]。最后,由函數(shù)Solution()計(jì)算出特征向量eigenVectors[,]、特征值eigenValue、累積貢獻(xiàn)率cumulative_proportion及主成分prin[,]。圖2模型的類描述圖4異常數(shù)據(jù)分析為了驗(yàn)證模糊主成分分析方法的有效性,應(yīng)用實(shí)際的觀測(cè)數(shù)據(jù)進(jìn)行分析對(duì)比。表1列出各國(guó)家和地區(qū)男子田徑紀(jì)錄的數(shù)據(jù)(本文只選取了8個(gè)國(guó)家和地區(qū)):初步觀察數(shù)據(jù),澳大利亞在1500m田徑比賽時(shí)所測(cè)紀(jì)錄37.5是異常數(shù)據(jù),出現(xiàn)了極端值。顯然,經(jīng)考察正確觀測(cè)記錄應(yīng)為3.75。為了說(shuō)明模糊主成分分析具有更好的抗干擾能力,應(yīng)用兩種方法先后對(duì)沒(méi)有異常數(shù)據(jù)和有異常數(shù)據(jù)的紀(jì)錄進(jìn)行分析,分析結(jié)果如下:從表2與表3可以看出,在正常情況下,經(jīng)典協(xié)方差與模糊協(xié)方差矩陣的特征向量與沒(méi)有什么差別。但是,當(dāng)實(shí)際觀測(cè)數(shù)據(jù)中存在個(gè)別誤差較大的數(shù)據(jù)時(shí),經(jīng)典協(xié)方差與模糊協(xié)方差矩陣的特征向量之間差別較大,如表4,表5所示。此時(shí),?d22=0.000376?？梢?jiàn),當(dāng)實(shí)測(cè)數(shù)據(jù)有異常數(shù)據(jù)出現(xiàn),導(dǎo)致經(jīng)典協(xié)方差的計(jì)算結(jié)果出現(xiàn)較大偏差,顯然,經(jīng)典協(xié)方差計(jì)算方法對(duì)少量異常數(shù)據(jù)的抗干擾能力較差,計(jì)算結(jié)果未能準(zhǔn)確的反映實(shí)際觀測(cè)數(shù)據(jù)的真實(shí)情況。而模糊協(xié)方差的抗干擾能力較強(qiáng)。由于存在少量異常數(shù)據(jù),迭代次數(shù)明顯增加,但計(jì)算結(jié)果更接近實(shí)測(cè)數(shù)據(jù)的真實(shí)統(tǒng)計(jì)特征,從而使得分析結(jié)果更加客觀。5第二,增強(qiáng)了決策結(jié)果的準(zhǔn)確性

人人文庫(kù)> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

模糊主成分分析的改進(jìn)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

模糊主成分分析的改進(jìn)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔