高光譜數(shù)據(jù)降維與可分性準(zhǔn)則_第1頁
高光譜數(shù)據(jù)降維與可分性準(zhǔn)則_第2頁
高光譜數(shù)據(jù)降維與可分性準(zhǔn)則_第3頁
高光譜數(shù)據(jù)降維與可分性準(zhǔn)則_第4頁
高光譜數(shù)據(jù)降維與可分性準(zhǔn)則_第5頁
已閱讀5頁,還剩43頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

高光譜數(shù)據(jù)降維與可分性準(zhǔn)則1第1頁,共48頁,2023年,2月20日,星期三第1節(jié)高光譜數(shù)據(jù)降維與可分性準(zhǔn)則

武漢大學(xué)遙感信息工程學(xué)院

龔龑

《高光譜遙感》第四章高光譜數(shù)據(jù)處理第2頁,共48頁,2023年,2月20日,星期三一、高光譜數(shù)據(jù)的降維問題二、類別可分性準(zhǔn)則三、基于幾何距離的可分性準(zhǔn)則四、基于類的概率密度的可分性準(zhǔn)則第四章第1節(jié)高光譜數(shù)據(jù)降維與可分性準(zhǔn)則第3頁,共48頁,2023年,2月20日,星期三高光譜分辨率的影響

在給定的波長區(qū)間內(nèi),高的光譜分辨率導(dǎo)致影像波段數(shù)眾多、連續(xù)。

一方面,高光譜遙感的核心優(yōu)勢是反映光譜特征的細(xì)微差異;另一方面眾多的波段數(shù)目給數(shù)據(jù)處理帶來新的問題。一、高光譜數(shù)據(jù)的降維問題1.1高光譜數(shù)據(jù)的高維特征第4頁,共48頁,2023年,2月20日,星期三波譜空間與光譜空間波段數(shù)眾多導(dǎo)致光譜空間維數(shù)的增多高光譜多光譜灰度值灰度值一、高光譜數(shù)據(jù)的降維問題1.1高光譜數(shù)據(jù)的高維特征波段數(shù)眾多導(dǎo)致波譜曲線信息的豐富“維數(shù)”是指光譜空間的維數(shù)第5頁,共48頁,2023年,2月20日,星期三

高光譜影像屬于高維空間數(shù)據(jù),已有的研究結(jié)果表明,這種數(shù)據(jù)有許多不同于低維數(shù)據(jù)的分布特性,這些特性決定了人們在對高光譜影像分析時應(yīng)采用不同策略和方法。一、高光譜數(shù)據(jù)的降維問題1.1高光譜數(shù)據(jù)的高維特征第6頁,共48頁,2023年,2月20日,星期三1.信息冗余大

波段數(shù)量多,但并非每個波段在任何時候都是有用信息。波段之間的相關(guān)性導(dǎo)致信息冗余很大,尤其是相鄰波段之間的相關(guān)性很強(qiáng)。一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題

例如:對于有N個波段的高光譜數(shù)據(jù)來講,當(dāng)前應(yīng)用需求是區(qū)分w1類和w2類。

如果利用任意一個波段都能達(dá)到這個目的,那么,僅取一個波段就包含了足夠信息,其余N-1維特征就是多余的。第7頁,共48頁,2023年,2月20日,星期三

根據(jù)超維立方體的體積公式,隨著空間維數(shù)的增加,超立方體的體積急劇增加,并且向角部分布。一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題2.超維幾何體體積第8頁,共48頁,2023年,2月20日,星期三一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題2.超維幾何體體積伽馬函數(shù)超立方體中內(nèi)切求的體積與超立方體之比第9頁,共48頁,2023年,2月20日,星期三例如:密度分析GRID算法一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題2.超維幾何體體積

由于體積因素影響,高維空間中數(shù)據(jù)的分布呈現(xiàn)出稀疏、嚴(yán)重不規(guī)則等特點(diǎn),使得常規(guī)的分析算法效果不佳。

第10頁,共48頁,2023年,2月20日,星期三

思考:既然不同波段包含了不同光譜信息,那么,在利用遙感影像分類時,是否波段越多,分類越精確?研究表明,事實(shí)并非如此一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題3.“維數(shù)災(zāi)難”問題第11頁,共48頁,2023年,2月20日,星期三一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題3.“維數(shù)災(zāi)難”問題第12頁,共48頁,2023年,2月20日,星期三

這說明高光譜數(shù)據(jù)區(qū)分地類之間的能力極大地受到訓(xùn)練樣本的限制,在分析高光譜影像時,要獲得好的分類精度就需要更多的訓(xùn)練樣本。

如果訓(xùn)練樣本不足時,往往會出現(xiàn)在樣本點(diǎn)數(shù)目一定的前提下,分類精度隨著特征維數(shù)的增加“先增后降”的現(xiàn)象,這就是所謂的Hughes”維數(shù)災(zāi)難”現(xiàn)象。一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題3.“維數(shù)災(zāi)難”問題第13頁,共48頁,2023年,2月20日,星期三

隨著空間維數(shù)的增加,要得到同樣精度的估計(jì)值將需要更多的樣本數(shù)。

研究表明,對于監(jiān)督分類而言,若要得到比較滿意的分類結(jié)果:一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題4.高維空間中的參數(shù)估計(jì)問題

線性分類器需要的樣本數(shù)與空間的維數(shù)呈線性關(guān)系。

對于基于二次估計(jì)量的分類器,所需的樣本數(shù)與空間的維數(shù)呈平方關(guān)系。第14頁,共48頁,2023年,2月20日,星期三模式識別的類別統(tǒng)計(jì)信息向量均值和方差等根據(jù)訓(xùn)練樣本估算出來訓(xùn)練樣本的數(shù)目相對于特征空間的維數(shù)的比例參數(shù)估計(jì)不準(zhǔn)確分類精度較低多光譜圖像高高光譜圖像低一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題4.高維空間中的參數(shù)估計(jì)問題因此,“維數(shù)災(zāi)難”現(xiàn)象可以從樣本數(shù)量與數(shù)據(jù)復(fù)雜度關(guān)系理論來解釋分類精度較高參數(shù)估計(jì)較準(zhǔn)確第15頁,共48頁,2023年,2月20日,星期三

在高維數(shù)據(jù)空間中,除了數(shù)據(jù)點(diǎn)分布的絕對位置以外,數(shù)據(jù)分布的形狀和方向?qū)τ诜诸惥哂懈又匾挠绊懽饔谩R?、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題5.高階統(tǒng)計(jì)特性第16頁,共48頁,2023年,2月20日,星期三一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題5.高階統(tǒng)計(jì)特性第17頁,共48頁,2023年,2月20日,星期三

在低維空間,只使用均值向量進(jìn)行分類的結(jié)果比只使用方差信息得到的結(jié)果的精度高,說明在此種情況下,在分類過程中數(shù)據(jù)分布的位置比分布的形狀和方向作用要大的多,這也是人們通常遇到的情況。

但是,當(dāng)維數(shù)增加時,只考慮均值信息進(jìn)行分類的精度并不再增加,而考慮方差信息的分類精度卻隨著特征維數(shù)的增加而繼續(xù)增加。一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題5.高階統(tǒng)計(jì)特性第18頁,共48頁,2023年,2月20日,星期三綜上所述,高維特征引起了多種問題

因此,在高光譜數(shù)據(jù)應(yīng)用的特定階段,可以對高維數(shù)據(jù)進(jìn)行降維處理,得到具有代表意義的低維光譜特征,并在低維光譜空間中進(jìn)行相應(yīng)分析(聚類分析)。

信息冗余大超維幾何體體積“維數(shù)災(zāi)難”問題高維空間中的參數(shù)估計(jì)問題高階統(tǒng)計(jì)特性一、高光譜數(shù)據(jù)的降維問題1.2高維特征帶來的新問題第19頁,共48頁,2023年,2月20日,星期三

若為D維空間中的一個容量為N的數(shù)據(jù)集合,假設(shè)其來自于維數(shù)為D的某一數(shù)據(jù)集的采樣。降維的目標(biāo)是探求數(shù)據(jù)集合適的低維坐標(biāo)描述,將原數(shù)據(jù)集合投影到低維空間,獲得原數(shù)據(jù)集合的低維簡潔表示。一、高光譜數(shù)據(jù)的降維問題1.3高光譜降維

方法:波段選擇特征變換第20頁,共48頁,2023年,2月20日,星期三

注意不要走向另一個極端:降維絕對不是對高維光譜信息的舍棄,而是立足于高維數(shù)據(jù),針對不同的使用目的得到相應(yīng)低維數(shù)據(jù)。

圖書館的書種類繁多,不同專業(yè)的同學(xué)各取所需,只選一小部分,但并不意味著其它的書是多余的。一、高光譜數(shù)據(jù)的降維問題1.3高光譜降維第21頁,共48頁,2023年,2月20日,星期三高光譜數(shù)據(jù)降維的方法

波段選擇特征變換具體內(nèi)容在下一講中介紹

降維后得到的低維特征空間是否有效進(jìn)行類別區(qū)分?一、高光譜數(shù)據(jù)的降維問題1.3高光譜降維第22頁,共48頁,2023年,2月20日,星期三一、高光譜數(shù)據(jù)的降維問題二、類別可分性準(zhǔn)則三、基于幾何距離的可分性準(zhǔn)則四、基于類的概率密度的可分性準(zhǔn)則第四章第1節(jié)高光譜數(shù)據(jù)降維與可分性準(zhǔn)則第23頁,共48頁,2023年,2月20日,星期三降維得到低維特征形成特征空間分布不同可分性存在差異衡量可分性?可分性判據(jù)定量化的指標(biāo)指導(dǎo)降維二、類別可分性準(zhǔn)則2.1高光譜數(shù)據(jù)降維與類別可分性判據(jù)的關(guān)系第24頁,共48頁,2023年,2月20日,星期三概念:從高維數(shù)據(jù)中得到了一組用來分類的特征,需要一個定量的標(biāo)準(zhǔn)來衡量特征對分類的有效性。2.2可分性準(zhǔn)則基本概念

可分性準(zhǔn)則二、類別可分性準(zhǔn)則可分性準(zhǔn)則的主要類型:

基于幾何距離的可分性準(zhǔn)則基于概率密度的可分性準(zhǔn)則特點(diǎn):通過已知類別先驗(yàn)知識,衡量當(dāng)前特征空間對類別的區(qū)分效果。第25頁,共48頁,2023年,2月20日,星期三一、高光譜數(shù)據(jù)的降維問題二、類別可分性準(zhǔn)則三、基于幾何距離的可分性準(zhǔn)則四、基于類的概率密度的可分性準(zhǔn)則第四章第1節(jié)高光譜數(shù)據(jù)降維與可分性準(zhǔn)則第26頁,共48頁,2023年,2月20日,星期三

不同的類別不同的分布區(qū)域

類別可分性區(qū)域可分性

區(qū)域可分性通過幾何距離來度量三、基于幾何距離的可分性準(zhǔn)則3.1基本思想第27頁,共48頁,2023年,2月20日,星期三1.點(diǎn)與點(diǎn)的距離在維特征空間中,特征點(diǎn)與特征點(diǎn)之間的歐氏距離為:3.2幾何距離可分性準(zhǔn)則原理三、基于幾何距離的可分性準(zhǔn)則第28頁,共48頁,2023年,2月20日,星期三當(dāng)前點(diǎn)與點(diǎn)集中每個點(diǎn)逐個計(jì)算距離2.點(diǎn)與點(diǎn)集的距離3.2幾何距離可分性準(zhǔn)則原理三、基于幾何距離的可分性準(zhǔn)則第29頁,共48頁,2023年,2月20日,星期三總體的均值矢量類內(nèi)的均值矢量3.類內(nèi)及總體的均值矢量3.2幾何距離可分性準(zhǔn)則原理三、基于幾何距離的可分性準(zhǔn)則第30頁,共48頁,2023年,2月20日,星期三類內(nèi)均方歐氏距離定義為:類內(nèi)均方距離也可定義為:3.2幾何距離可分性準(zhǔn)則原理4.類內(nèi)距離先求出各自到類心的距離的平方,再求和兩兩運(yùn)算,不涉及類心三、基于幾何距離的可分性準(zhǔn)則第31頁,共48頁,2023年,2月20日,星期三

類內(nèi)離差矩陣,反映類內(nèi)部樣本在均值周圍的散布情況。(矩陣的跡)與類內(nèi)均方歐氏距離的關(guān)系:3.2幾何距離可分性準(zhǔn)則原理5.類內(nèi)離差矩陣三、基于幾何距離的可分性準(zhǔn)則第32頁,共48頁,2023年,2月20日,星期三兩類樣本之間的距離X1X2X3Y1Y2A類B類兩兩之間3.2幾何距離可分性準(zhǔn)則原理6.兩類之間的距離三、基于幾何距離的可分性準(zhǔn)則第33頁,共48頁,2023年,2月20日,星期三取歐氏距離時,總的均方距離為總的樣本距離兩類樣本之間的距離類與類兩兩求和3.2幾何距離可分性準(zhǔn)則原理7.各類總的均方距離三、基于幾何距離的可分性準(zhǔn)則第34頁,共48頁,2023年,2月20日,星期三第i類的離差矩陣第i類的比例A.總的類內(nèi)離差矩陣3.2幾何距離可分性準(zhǔn)則原理7.多類情況離差矩陣三、基于幾何距離的可分性準(zhǔn)則第35頁,共48頁,2023年,2月20日,星期三第i類樣本均值總體樣本均值每一類只有一個代表B.類間離差矩陣3.2幾何距離可分性準(zhǔn)則原理7.多類情況離差矩陣三、基于幾何距離的可分性準(zhǔn)則第36頁,共48頁,2023年,2月20日,星期三任一樣本

實(shí)質(zhì)是樣本總體的協(xié)方差矩陣不涉及類的概念總體樣本均值C.總體離差矩陣3.2幾何距離可分性準(zhǔn)則原理7.多類情況離差矩陣三、基于幾何距離的可分性準(zhǔn)則第37頁,共48頁,2023年,2月20日,星期三點(diǎn)與點(diǎn)的距離點(diǎn)到點(diǎn)集類內(nèi)的均值矢量類內(nèi)距離類內(nèi)均方距離類內(nèi)離差矩陣總體的均值矢量兩類之間的距離總體離差矩陣各類模式之間總的均方距離如何通過幾何距離衡量可分性?三、基于幾何距離的可分性準(zhǔn)則3.3判據(jù)構(gòu)造1.離差矩陣分析第38頁,共48頁,2023年,2月20日,星期三樣本的散布程度樣本越分散矩陣數(shù)值越大

類的內(nèi)部越緊密越好類之間越分散越好降維方案1降維方案2樣本的類別信息已知越小越好越大越好情況復(fù)雜三、基于幾何距離的可分性準(zhǔn)則3.3判據(jù)構(gòu)造1.離差矩陣分析第39頁,共48頁,2023年,2月20日,星期三原則:數(shù)值的大小直接體現(xiàn)降維后特征空間的類別可分性。常見判據(jù):3.3判據(jù)構(gòu)造2.依據(jù)可分性準(zhǔn)則構(gòu)造判據(jù)三、基于幾何距離的可分性準(zhǔn)則第40頁,共48頁,2023年,2月20日,星期三一、高光譜數(shù)據(jù)的降維問題二、類別可分性準(zhǔn)則三、基于幾何距離的可分性準(zhǔn)則四、基于類的概率密度的可分性準(zhǔn)則第四章第1節(jié)高光譜數(shù)據(jù)降維與可分性準(zhǔn)則第41頁,共48頁,2023年,2月20日,星期三

先驗(yàn)概率后驗(yàn)概率條件概率在樣本集中,預(yù)先已知的某一類出現(xiàn)的概率P(Wi)對于樣本集中的某一模式x,它屬于某類Wi的概率P(Wi|x)在某一類Wi中,模式x出現(xiàn)的概率P(x|Wi)4.1基本概念回顧四、基于概率密度的可分性準(zhǔn)則第42頁,共48頁,2023年,2月20日,星期三W1

W2

P(x|W1)P(x|W2)P100%0%W2W1100%W1

W2

P(x|W1)P(x|W2)P0%W1W2

各類的條件概率密度函數(shù)P(x|Wi)重疊度越低,特征可分性越好。四、基于概率密度的可分性準(zhǔn)則4.2概率密度分析第43頁,共48頁,2023年,2月20日,星期三可分性判據(jù)的設(shè)定衡量概率密度重疊度立足于基本性質(zhì):

Jp>=0;

當(dāng)兩類概率密度完全不重疊時,Jp取最大值;

當(dāng)兩類概率密度完全重疊時,Jp等于0;

兩類概率密度具有“對稱性”。四、基于概率密度的可分性準(zhǔn)則4.3基本性質(zhì)第44頁,共48頁,2023年,2月20日,星期三

進(jìn)行相關(guān)性運(yùn)算,實(shí)際上是對兩個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論