高光譜遙感數(shù)據(jù)的特征選擇與提取PPT通用PPT課件_第1頁
高光譜遙感數(shù)據(jù)的特征選擇與提取PPT通用PPT課件_第2頁
高光譜遙感數(shù)據(jù)的特征選擇與提取PPT通用PPT課件_第3頁
高光譜遙感數(shù)據(jù)的特征選擇與提取PPT通用PPT課件_第4頁
高光譜遙感數(shù)據(jù)的特征選擇與提取PPT通用PPT課件_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、1第五章 高光譜遙感數(shù)據(jù)的特征選擇與提取 本章主要介紹高光譜遙感數(shù)據(jù)的可分性標(biāo)準(zhǔn),光譜特征選擇,光譜自相關(guān)性分析,特征提取以及投影變換等內(nèi)容。2高光譜遙感數(shù)據(jù)有助于我們完成更加細(xì)致的遙感地物分類和目標(biāo)識別,然而波段的增多也必然導(dǎo)致信息的冗余和數(shù)據(jù)處理復(fù)雜性的增加。 具體表現(xiàn)在:(1)數(shù)據(jù)量急劇增加:波段的增加,使得高光譜數(shù)據(jù)比傳統(tǒng)數(shù)據(jù)多1-2個數(shù)量級,表現(xiàn)在顯示,存儲,管理方面相當(dāng)繁瑣(2)計算量增大:數(shù)據(jù)的膨脹導(dǎo)致計算機(jī)處理載荷大幅度增加,尋找有效地降維空間手段是必要的(3)統(tǒng)計參數(shù)的估計誤差增大:利用統(tǒng)計方法為了達(dá)到比較精確的估計,樣本個數(shù)一般是波段數(shù)的100倍以上,這在高光譜數(shù)據(jù)中往往無

2、法實(shí)現(xiàn),因此,導(dǎo)致了分類精度的普遍下降。3當(dāng)光譜維數(shù)增加的時候,特征組合形式成指數(shù)倍增加,例如原始波段為N,優(yōu)選后的光譜波段是M,那么光譜特征組合數(shù)為:N!/(N-M)!/M!。顯然這個數(shù)目很巨大,直接導(dǎo)致了運(yùn)算效率下降,因此,如何優(yōu)化光譜特征空間,進(jìn)行光譜選擇非常重要。問題提出?4該圖列出了波段數(shù)增加時,不同的樣本個數(shù)與類別可分性的變化5為了進(jìn)行最優(yōu)選擇,我們需要一個準(zhǔn)則來衡量。如果特征可以進(jìn)行分類,那么我們利用分類的錯誤概率來作為特征選擇的準(zhǔn)則。前人的研究表明:可分性越高的特征,分類錯誤的概率越低,選擇的特征越優(yōu)。最優(yōu)特征分類錯誤概率可分性5.1 最優(yōu)特征的選擇可分性6可分性準(zhǔn)則選擇可分性

3、準(zhǔn)則必須綜合考慮兩個策略:一、選擇各類平均可分性最大的特征二、選擇最難分的類別具有的可分性最大的特征第一個策略能均衡照顧到各類的可分性;第二個策略能照顧到最難分的類別。7設(shè)計光譜可分性的準(zhǔn)則必須滿足三個方面的要求(黃鳳崗等,1998):(1)與錯誤概率具有單調(diào)關(guān)系。這樣準(zhǔn)則取最大值的情況下,所得到的錯誤概率應(yīng)該是最小的。(2)度量特性。設(shè)定兩類地物類別i,j的度量特性為 , 越大,兩類特征的分離程度越大。(3)單調(diào)性。新加入的特征,準(zhǔn)則函數(shù)的值并不減小。光譜可分性準(zhǔn)則8滿足這個策略的可分性準(zhǔn)則有很多,歸納起來可以分為以下四種準(zhǔn)則: (1)各樣本之間的平均距離; (2)類別間的相對距離; (3)

4、離散度; (4)J-M距離;可分性準(zhǔn)則所描述的指標(biāo)9(1)各類樣本間的平均距離各類樣本之間的距離越大,類別可分性越大,因此可以利用各類樣本之間的距離的平均值作為可分性的準(zhǔn)則。例如:常用的距離函數(shù)有歐氏距離,馬氏距離,明氏距離等。但是,很多情況下,類別之間的平均距離并不一定代表了類別之間的可分性。如下圖所示10兩種分布的可分性比較類別間的距離平均值不能完全反映類別的可分性11(2)類別間的歸一化距離根據(jù)費(fèi)歇爾準(zhǔn)則,分類時總是希望類內(nèi)的離散度盡量小,類間的離散度盡量大,那么根據(jù)這個定律,可以作為相對距離的一個度量,度量的公式為歸一化距離:1213當(dāng)我們用這個距離公式衡量類別的可分性的時候,存在這樣

5、的情況,無法衡量兩類的差別:14(3)離散度離散度可以克服當(dāng)兩個類別均值相等時,不能有效區(qū)分類別的局限,離散度表達(dá)式為:當(dāng)類別多于兩個時,可以用平均離散度來衡量類別可分性。15盡管離散度克服了類均值相等給歸一化距離帶來的麻煩,但是并非最優(yōu)的類別可分性度量,當(dāng)樣本的分布存在的情況如下圖所示的時候,離散度并不能有效的反映可分性(b的可分性顯然要高于a)16(4)J-M 距離(Jeffries-Matusita )J-M距離基于條件概率理論,其表達(dá)式可以近似為:P代表第i個像元屬于w的條件概率。17總結(jié)1)可分性準(zhǔn)則中J-M距離的可分性效果是最好的,J-M距離實(shí)際上就是兩類概率密度函數(shù)之差,基于先驗(yàn)

6、概率和樣本分布。2)離散度的可分性效果總體不如J-M距離,但是當(dāng)各類模式分布相對集中,模式距離沒有超出臨界值時,也比較有效。3)歸一化距離的衡量有效性又次之。加入樣本均值十分接近,或者過于分散,會喪失有效性。4)各樣本距離的平均值用來衡量可分性,效果最差。只有當(dāng)樣本的各個分布一致,且既不太離散也不太集中的特殊情況下,才有效。185.2 光譜特征選擇19通過特征選擇,可以強(qiáng)化最具可分性的光譜波段,這里分為:光譜特征位置搜索和光譜距離統(tǒng)計。光譜特征位置搜索:根據(jù)專家對特定地物的物理化學(xué)性質(zhì)和光譜特性分析,選擇最具有排他性的光譜特征波段。光譜距離統(tǒng)計:在光譜可分性距離的統(tǒng)計準(zhǔn)則下,選擇光譜波段子集,

7、使得在某一個光譜可分性距離統(tǒng)計準(zhǔn)則下,其統(tǒng)計差異最大或者最優(yōu)。201.光譜特征位置搜索特征位置通常是要確定特征吸收波段的位置分為以下三個部分: 1)包絡(luò)線去除(包絡(luò)線歸一化)包絡(luò)線從外觀上面來看,相當(dāng)于光譜曲線的“外殼”,我們用連續(xù)的這種折線段來近似表示光譜曲線的包絡(luò)線。21手工搜索:利用定義手工逐點(diǎn)直線連接突出的“峰”值點(diǎn),并使得折線在“峰”值點(diǎn)的外角180度,然后用實(shí)際光譜波段值去除相應(yīng)的波段值,這樣歸一化后,峰值點(diǎn)均為1,非“峰”值點(diǎn)均小于1。這樣就很容易測定吸收特征參數(shù)。22計算機(jī)搜索:23由包絡(luò)線去除法調(diào)整的明礬石光譜曲線24包絡(luò)線去除前后的光譜反射率曲線對比25舉例說明:經(jīng)過包絡(luò)線

8、去除后,可以有效的區(qū)分高嶺石與白云石的有效區(qū)間,這里挑選5個特征波段: B1(2.16) B2(2.18) B3(2.21) B4(2.32) B5(2.38)2)選擇特征波段區(qū)分地物26以上的五個特征可以構(gòu)成一個凸面幾何空間,高嶺石與白云石在這個投影變換后的特征空間集中在兩個彼此分離的區(qū)間,兩者能夠完全區(qū)分273)基于特征位置進(jìn)行彩色合成高光譜影像具有上百個通道,但是彩色合成只有三個通道,因此選擇RGB的合成方案非常重要。利用特征位置,可以縮小候選區(qū)域,突出感興趣像元光譜的提取以及感興趣區(qū)域的劃分。28下圖是一種地物的光譜曲線,在1.4微米附近有一個特征吸收峰,如果在此特征吸收波段賦值為綠色

9、,在兩邊的非吸收通道賦值為紅色和藍(lán)色,那么在RGB合成圖像里面,紫紅色的像元就應(yīng)該是具有該吸收特征的地物。這樣可以為我們進(jìn)行ROI的選擇提供幫助。29高光譜遙感圖像波段眾多,如何在可分性的基礎(chǔ)上,從n個特征中選擇m個最優(yōu)子集?介紹兩種算法:(1)單獨(dú)選擇法(按照平均可分性) 根據(jù)可分性準(zhǔn)則函數(shù)計算n個特征中每個特征可分性,然后根據(jù)各個特征的可分性大小進(jìn)行排序,選擇可分性最大的前m(nm)個特征。2.光譜距離統(tǒng)計30(2)擴(kuò)充最優(yōu)特征子集(平均可分性)一、計算每個特征對應(yīng)的所有類別的可分性,選擇可分性最大的進(jìn)入到最優(yōu)子集當(dāng)中;二、增加一個特征構(gòu)成新的特征集,重新計算特征集合的可分性,選擇最大的特

10、征組合作為新的最優(yōu)子集。三、重復(fù)執(zhí)行第二步,直到最優(yōu)的特征子集達(dá)到m個為止。31必須指出的是以上的算法均假設(shè)各個特征之間相互獨(dú)立,沒有考慮特征之間的相關(guān)性。實(shí)際上,各個特征之間是存在相關(guān)性的,首先應(yīng)該剔除一些可分性小,與其他特征相關(guān)性大的特征,選擇最優(yōu),可分性最大的特征組。注意:32光譜距離統(tǒng)計33光譜相關(guān)性是指圖像同一空間位置的像素在各波段有相似性。原因:光譜圖像的每個波段圖像的像素值,是相同區(qū)域地物對各個波段光的反射強(qiáng)度值,相鄰波地物反射率是相近的,由此產(chǎn)生了一定的相關(guān)性。光譜相關(guān)性的大小很大程度上是由光譜分辨率決定的,光譜分辨率越高,統(tǒng)計相關(guān)性也越高。5.3 光譜自相關(guān)性分析34光譜相關(guān)

11、性波段選擇光譜波段選擇一般遵循以下3個原則:一、所選擇的波段信息總量要大二、所選的波段相關(guān)性弱三、目標(biāo)地物類型要在所選的波段組合內(nèi)與其他地物有很好的可分性。35選擇最優(yōu)波段的方法(1)方差法。最簡單的挑選方式,每一個波段中單個像元的亮度值與平均亮度值差的平方和,再取平均數(shù)。單波段的方差越大,表明波段的離散程度越大,信息量越豐富。 36各波段的方差(標(biāo)準(zhǔn)差)反映了圖像各像元灰度值與平均值總的離散度,一定程度上反映了各波段信息量,其值越大,所包含的信息量越大,地物之間越容易區(qū)分。下面以一幅128個波段的omis影像為例,介紹圖像方差(標(biāo)準(zhǔn)差)所反應(yīng)出來的圖像信息量大小。37(a)第10 波段的圖像

12、(b)第65波段的圖像(C)第126 波段的圖像38圖像在128個波段的標(biāo)準(zhǔn)差??梢钥闯觯ǘ?5-96這些波段的標(biāo)準(zhǔn)差較?。◣缀醵夹∮?0),所以這些波段子集包含的信息量就少。而波段27-30,35-39,113-114,116-118的標(biāo)準(zhǔn)差較大(基本都大于400),這些波段包含的信息量就較多。高光譜遙感圖像各波段的信息量分布并沒有規(guī)律,在一個很小的波長范圍內(nèi),各波段的信息量分布不均勻。就是相鄰兩個波段的信息量有時差別也很大。39(2)相關(guān)系數(shù)法通過相關(guān)系數(shù)r(-11之間)來比較兩個光譜圖像之間的相關(guān)性,它反映了不同變量之間的相關(guān)程度,R越大,說明波段問信息重疊越大。它的大小取決于兩個變量

13、之間的協(xié)方差和它們各自的標(biāo)準(zhǔn)差,其計算公式為:這里定義j=i+1,即:比較相鄰兩個波段之間的相關(guān)性,可以用下面的表來顯示40相鄰波段之間相關(guān)系數(shù)表41用圖像的直方圖形式來統(tǒng)計相關(guān)性424344相關(guān)系數(shù)也可以用來比較其他的參量45原理:由前面兩種評判的原則組成。即:圖像數(shù)據(jù)的標(biāo)準(zhǔn)差越大所包含的信息量也越大,波段間的相關(guān)系數(shù)越小,表明各波段圖像數(shù)據(jù)的獨(dú)立性越高,信息的冗余度越小。計算公式如下:S代表標(biāo)準(zhǔn)差,R代表相關(guān)系數(shù)此方法是目前最常用的波段選擇方法。計算方法簡單,易于操作,且更接近于波段選擇的原則。 (3)OIF( Optimum index最佳指數(shù))46利用Gearys C指數(shù)衡量空間相關(guān)性

14、指標(biāo),衡量標(biāo)準(zhǔn)在于:通過該指數(shù),選擇出來的波段,在地物集中區(qū)域的灰度反差越大越好(圖像清晰明了),波段之間越獨(dú)立越好(消除相關(guān)性)。Gearys C指數(shù)公式如下:z代表感興趣的屬性值;w代表權(quán)值;i,j分別是兩個不同像元(4)空間自相關(guān)性評價47利用Gearys c值可以反映兩個方面的情況: (1) 反映影像質(zhì)量。影像的Gearys c值越小,方差越大,影像質(zhì)量越高例:選擇某一幅高光譜圖像,下面是它的兩個不同波段影像。可以分別通過:目視;方差或Gearys值來判斷兩幅圖像質(zhì)量的差異。Gearys c=0.428Gearys c=0.16948Gearys c值反映波段之間相關(guān)性 分別為0.61

15、7與0.223(2)選擇波段。比較兩個波段的比值圖像的空間自相關(guān)值, Gearys c的值越小,說明構(gòu)成比值的圖像信息量越大,兩波段應(yīng)入選。例:選擇兩個不同的比值圖像進(jìn)行實(shí)驗(yàn),第一幅是選擇強(qiáng)烈相關(guān)的中心波長為:0.727與0.724;第二幅是選擇不相關(guān)的中心波長為:0.727與0.548。495.4 光譜特征的提取光譜特征的提取是光譜特征空間降維的過程?,F(xiàn)有的降維方法可以分兩類:1、基于非變換的,如:利用光譜位置搜索進(jìn)行波段選擇,人工選取感興趣波段,它的優(yōu)點(diǎn)是保持了圖像的原有特征;2、基于變換的方法,如:主成分分析PCA(K-L變換),最小噪聲分離變換MNF,小波變換等,基于變換的降維方式的優(yōu)

16、點(diǎn)是可以經(jīng)過若干變換直接將高維數(shù)據(jù)降低到幾維,降維速度快。(主要進(jìn)行描述的方法)50一、基于主成分變換 K-L變換是建立在統(tǒng)計特征基礎(chǔ)上的多維正交線性變換,多波段圖像通過這種變換后產(chǎn)生一組新的組分圖像(按照方差從大到小排列)。組分圖像數(shù)目可以等于或少于原來圖像的波段數(shù)目。一幅高光譜圖像通過KL變換能夠把原來多個波段中的有用信息盡量集中到數(shù)目盡可能少的新的組分圖像中,使圖像數(shù)據(jù)得到有效的壓縮,而且還能夠使新的組分圖像中的組分之間互不相關(guān)。幾何學(xué)上:把原來的坐標(biāo)系旋轉(zhuǎn)形成新的坐標(biāo)系,使新的坐標(biāo)軸通過樣本方差最大的方向。51 為主分量變換后圖像的m維向量 為主分量變換前圖像的m維向量, 變換矩陣為由

17、原始圖像的協(xié)方差矩陣的特征向量組成,特征向量是按其對應(yīng)的特征值由大到小的順序,重新進(jìn)行排列而成 主成分分析方法可用變換矩陣表示如下:52根據(jù)KL變換的定義,有m個波段的高光譜圖像KL變換的過程概括如下:5354(a)第1波段圖像(C)第5波段圖像(d)第7波段圖像(b)第4波段圖像128個波段的omis影像進(jìn)行主成份分析以后的結(jié)果圖像55從圖中可以看出變換后的新波段各主分量包含的信息量呈逐漸減少的趨勢,經(jīng)KL變換后圖像的標(biāo)準(zhǔn)差曲線圖56K-L變換后部份波段的譜間相關(guān)系數(shù)57經(jīng)過K-L變換后的RGB合成一般人眼對灰度的分辨率只有二三十種,而對彩色的分辨要比對灰度的分辨多得多,256種彩色對人眼來

18、說極為豐富。為此若一般的黑白圖像處理成彩色圖像,顯然可提高原圖像的分辨能力,獲得更好的判讀效果。原始遙感圖像共有128個波段,所以有128*127*126種合成方案。對原始高光譜圖像我們隨機(jī)選擇的50種方案。KL圖像我們選擇了30種方案,選出其中的兩幅圖像,對比如下:58 原始圖像的RGB圖(R:10 G:40 B 70)KL圖像的RGB圖(R:1 G:2 B:3)59原始圖像與KL變換圖像的對比60二、MNF變換(minimum noise fraction)最小噪聲分離法61MNF組成:可以認(rèn)為是由兩個串聯(lián)的主成分變換來組成。第一個主成分變換基于噪聲的協(xié)方差矩陣進(jìn)行的,去除相關(guān)性,重新調(diào)節(jié)

19、圖像中的噪聲分布。經(jīng)過這個處理以后,噪聲在各個波段之間沒有相關(guān)性。第二個主成分變換是標(biāo)準(zhǔn)的主成分變換。在變換后的前幾個分量圖像按照方差大小順序進(jìn)行排列,向后方差逐步減少,噪聲逐步增大,甚至全部為噪聲。物理意義62提取圖像端元光譜當(dāng)MNF變換完成之后,同時輸出每個分量的特征值,繪制特征值曲線,當(dāng)特征為1的時候,代表圖像中只有噪聲。端元光譜數(shù)量直接可以從特征值曲線上讀取,即特征值值降到1的波段位置。這種判斷方法并不一定正確,有時候需要增加維數(shù)。夏橋PHI高光譜:80波段波長范圍:0.41740.8544mm63mnf變換結(jié)果的第1分量,第4分量,第8分量,第13分量64三、穗帽變換穗帽變換(K-T

20、變換):是一種基于圖像物理特征上的固定轉(zhuǎn)換,與PCA變換相比,轉(zhuǎn)換后的圖像具有明確的物理意義,不隨數(shù)據(jù)而變,對于相同傳感器獲取的不同圖像,變換結(jié)果可以相互比較,因而得到了廣泛應(yīng)用。65對于MSS數(shù)據(jù)和TM數(shù)據(jù),提取植被或土壤信息的穗帽變換的變換系數(shù)矩陣分別為:MSSTM66實(shí)際應(yīng)用中,對不同的數(shù)據(jù),為防止出現(xiàn)負(fù)值,需要對變換后的像元矢量加一常數(shù)進(jìn)行修正。穗帽變換對于處理Landsat/MSS和TM數(shù)據(jù),尤其是提取的植被信息,由于是利用了所有波段的線性組合,提取的植被信息量比只利用兩個波段的植被指數(shù)NDVI要高。穗帽變換的缺點(diǎn)是依賴于傳感器,固定的轉(zhuǎn)換系數(shù)對其他傳感器不適用。6768四、典型分析

21、變換(CA) 與PCA主成分變換相比較 相同點(diǎn): 都是統(tǒng)計學(xué)角度出發(fā)的正交變換。 不同點(diǎn): PCA在對原始圖像缺少先驗(yàn)知識的基礎(chǔ)上計算原始圖像的總協(xié)方差等統(tǒng)計參數(shù) CA 針對具體的類別計算得到統(tǒng)計參量,變換矩陣能夠使得變換后的典型成分軸具有最大的類間方差和最小的類內(nèi)方差。變換后的典型軸按類別可分性大小依此排列。 69典型成分分析方法的步驟為:(1)首先利用類別樣本求出類內(nèi)協(xié)方差矩陣(2)再求樣本的類間協(xié)方差矩陣:(3)根據(jù)變換后,應(yīng)當(dāng)保證最大的類間方差和最小的類內(nèi)方差,組建特征方程:(4)將由特征方程求出的特征值從大到小排列,并求出對應(yīng)的特征向量矩陣,組建變換矩陣,對原始數(shù)據(jù)進(jìn)行變換,即可完成

22、CA變換。 70典型成分分析方法以類間方差最大和類內(nèi)方差最小作為優(yōu)化條件,使變換后第一主成分包含了最大的類間可分性信息,同時降低了數(shù)據(jù)維數(shù),有利于分類。但是,CA變換是基于類別統(tǒng)計分析的特征空間變換,對于高光譜數(shù)據(jù),需要大量的訓(xùn)練樣本,以便有足夠高的樣本數(shù)量和波段比,因此,得到類別協(xié)方差矩陣比較困難。典型分析變換(CA)的優(yōu)缺點(diǎn):715.5 高光譜投影變換歐式空間三維空間:向量x1,x2,x3在三維空間上必然可以分解為 x1,x2,x3=x11,0,0+x20,1,0+x30,0,1 這三個分量可以將任何三維向量線性表出。所以三維向量組成的幾何空間其實(shí)可以用這三個基表達(dá)出任何三維向量。向量和點(diǎn)對應(yīng),三維向量其實(shí)也是對應(yīng)三維直角坐標(biāo)系的一個點(diǎn)。n維空間:向量x1,x2,.,xn在n維空間上必然可以分解為 x1,x2,.,xn =x11,0,.,0+.+xn0,0,.,1 其實(shí)在n維空間上就是由n個基構(gòu)成的一個線性組合。一個n維向量其實(shí)就是一個n維歐式空間的一個點(diǎn)。只不過是有n個向量的。 72歐式空間單形體在歐氏空間中中,只有(n1)個頂點(diǎn)的凸面幾何體是n 維空間中最簡單的形式,稱之為單形體(simplex)。如一維空間中由兩個點(diǎn)確定的線段、二維空間中由三個點(diǎn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論