基于支持向量機(jī)的典型凍土區(qū)土壤制圖研究_第1頁
基于支持向量機(jī)的典型凍土區(qū)土壤制圖研究_第2頁
基于支持向量機(jī)的典型凍土區(qū)土壤制圖研究_第3頁
基于支持向量機(jī)的典型凍土區(qū)土壤制圖研究_第4頁
基于支持向量機(jī)的典型凍土區(qū)土壤制圖研究_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基于支持向量機(jī)的典型凍土區(qū)土壤制圖研究* 科技部基礎(chǔ)性工作專項(xiàng)(2008FY110200);科技部863項(xiàng)目(No.2008AA12Z205);國家自然科學(xué)基金(40871037)石偉 南卓銅 通訊作者,E-mail: nztong作者簡介:石偉(1987),男,碩士研究生,專業(yè)方向?yàn)檫b感和GIS應(yīng)用。E-mail: shiwei收稿日期:2010-07-22;收到修改稿日期:2010-11-XX 李韌 趙林 張秀敏 趙擁華(中國科學(xué)院寒區(qū)旱區(qū)環(huán)境與工程研究所,蘭州 730000) MACROBUTTON AcceptAllChangesShown 摘要 本研究基于青藏高原大片連續(xù)多年凍土分布

2、的東部邊緣,青海省興??h溫泉地區(qū)的野外調(diào)查數(shù)據(jù),通過對研究區(qū)遙感數(shù)據(jù)的分析,開展了土壤制圖方法的探討。它以成土因素學(xué)說和土壤-景觀模型理論為基礎(chǔ),篩選土壤分類潛在變量,在不同的變量組合下運(yùn)用支持向量機(jī)(SVM)的方法建立土壤-景觀模型,對整個(gè)研究區(qū)進(jìn)行預(yù)測性分類。為了更好地檢驗(yàn)該方法的有效性,采用五折交叉方式進(jìn)行結(jié)果的驗(yàn)證。并通過對比不同變量組合的交叉驗(yàn)證結(jié)果和分布模擬結(jié)果圖,確定了適合典型凍土區(qū)土壤分類的環(huán)境變量組合,以較少的樣本知識(shí)較好地預(yù)測該區(qū)土壤類型的空間分布。 MACROBUTTON AcceptAllChangesInDoc 關(guān)鍵詞 土壤制圖;支持向量機(jī);多年凍土區(qū);土壤分類中圖分

3、類號(hào) S159.9; O159 文獻(xiàn)標(biāo)識(shí)碼 A青藏高原地域廣闊,多年凍土廣泛發(fā)育,受多年凍土和強(qiáng)烈凍融作用的影響,土壤具有獨(dú)特的分布特征。土壤分布特征資料不僅是土地資源合理利用和區(qū)域畜牧業(yè)規(guī)劃的基礎(chǔ),同時(shí)也是各類陸面過程模式和區(qū)域乃至全球氣候模式所必須輸入的基礎(chǔ)數(shù)據(jù)資料。對于凍土發(fā)育的青藏高原,土壤類型的空間分布研究也有助于深入理解凍土發(fā)生發(fā)展的規(guī)律,從而促進(jìn)對凍土分布、退化過程、機(jī)制與防治措施方面的研究1。青藏高原土壤資源的調(diào)查研究和制圖工作主要基于幾次大型野外考察。中國科學(xué)院組織的青藏高原綜合科學(xué)考察隊(duì),1973年至1980年考察了青藏高原南都的西藏自治區(qū),1981年至1986年考察了青藏

4、高原東南部川西、藏東和滇西北的橫斷山區(qū),1987年至1992年考察了青藏高原西北部的喀拉昆侖山和昆侖山地區(qū),并先后發(fā)表專著西藏土壤、喀喇昆侖山-昆侖山地區(qū)土壤等,繪制了考察區(qū)域土壤類型圖2,其中以1:200萬、1:100萬等小比例尺土壤圖居多。這些土壤類型分布圖已經(jīng)不能滿足精準(zhǔn)農(nóng)牧業(yè)、環(huán)境管理及生態(tài)、陸面過程/氣候模型模擬等對高精度土壤類型分布信息的需求。同時(shí),傳統(tǒng)野外調(diào)查制圖是費(fèi)時(shí)費(fèi)力的過程,不但花費(fèi)成本高而且土壤信息更新速度慢。隨著3S技術(shù)的發(fā)展,基于土壤-景觀模型理論的預(yù)測性土壤制圖應(yīng)運(yùn)而生,彌補(bǔ)了傳統(tǒng)土壤制圖的不足3。這是一種以環(huán)境因子的空間分布來推測土壤的空間分布,生成土壤圖的方法。

5、青藏高原多年凍土廣泛發(fā)育,氣候環(huán)境條件復(fù)雜而特殊,影響土壤形成的環(huán)境變量有其特殊性。許多研究探索了建立土壤-景觀模型的方法,如多元線性回歸法4、決策樹分析法5、相似性模型6等,本文采用支持向量機(jī)的分類方法。支持向量機(jī)在國內(nèi)外諸多領(lǐng)域有廣泛應(yīng)用如電力、圖像識(shí)別、醫(yī)療、通信等7-10,在土壤分布研究中已經(jīng)開始有應(yīng)用11。其應(yīng)用于土壤分類主要有以下三個(gè)優(yōu)點(diǎn)。首先,能夠處理變量和因變量之間的非線性關(guān)系,而土壤的形成是多要素制約的非線性過程12,13。其次,支持向量機(jī)分類是通過在訓(xùn)練樣本中確定支持向量建立判別函數(shù)從而進(jìn)行分類的,是一種統(tǒng)計(jì)分類,不需要專家經(jīng)驗(yàn)。第三,其訓(xùn)練樣本無需滿足正態(tài)分布,對樣本數(shù)量

6、需求少,支持向量機(jī)不像決策樹、神經(jīng)網(wǎng)絡(luò)等傳統(tǒng)方法需要足夠大的樣本數(shù)量并必須滿足正態(tài)分布14,只需訓(xùn)練樣本中包含支持向量。本文以成土因素學(xué)說和土壤景觀模型理論為基礎(chǔ),運(yùn)用支持向量機(jī)的方法建立青藏高原典型凍土區(qū)溫泉區(qū)的土壤-景觀模型,從而對整個(gè)研究區(qū)進(jìn)行預(yù)測性分類,并生成研究區(qū)土壤圖。材料與方法研究區(qū)概況研究區(qū)位于青海省海南州西南部的溫泉區(qū)域,是季節(jié)凍土和大片連續(xù)多年凍土過渡的典型凍土區(qū)( REF _Ref266392412 h * MERGEFORMAT 圖1)。地理范圍為35.235.7N、99.199.6E,面積約3800km2,海拔34305300m。地形以山地、丘陵為主,有苦海灘和河流沖

7、積的瑪日塘地區(qū)盆地等。地貌類型豐富,有沖洪積扇、坡積群、谷地、河漫灘、河流階地等。微地貌類型也廣泛發(fā)育,凍脹土丘、階梯狀蠕動(dòng)、土環(huán)、石環(huán)等屢見不鮮,形成凍土區(qū)特有景觀。成土母質(zhì)類型多樣,包括殘積物、冰磧物、坡積物、洪積物、沖積物和湖積物。研究區(qū)內(nèi)河流縱橫,植被良好,據(jù)2009年溫泉區(qū)凍土本底調(diào)查工作報(bào)告,主要植被類型包括高寒草甸、高寒沼澤草甸、高寒草原和高寒灌叢,以高寒草甸和高寒草原為主(80以上)。高寒草甸以耐寒、密叢、短根莖的嵩草屬植物為主,多位于局地氣候相對濕潤的山地、河流間地等地區(qū),其中土壤含水量較高的為高寒沼澤草甸;高寒草原以耐寒、抗旱的叢生禾草為主,多位于盆地、丘陵地區(qū),在山間谷地

8、地帶也有分布,成土母質(zhì)相對貧瘠;高寒灌叢著生在有機(jī)質(zhì)含量高的土壤上,生長茂密,覆蓋度大,多位于山地陰坡位置,且沿山坡走勢呈條帶狀分布。該區(qū)所在地興海縣,氣溫較低、降水較少。年平均氣溫1.2,月平均氣溫從1月的-11.9至7月的12.5,年平均降水量355.6mm,月平均降水量從1月的1.3mm至7月的83.4mm15。研究區(qū)內(nèi)以牧業(yè)為主,兼有溫泉煤礦、螢石礦等小型礦區(qū)。按照中國土壤16分類標(biāo)準(zhǔn),該區(qū)分布有高山草甸土、高山草原土、高山漠土和高山寒漠土四類土壤。圖 SEQ 圖 * ARABIC 1 研究區(qū)概況Fig. SEQ Fig. * ARABIC 1 Topographic map of t

9、he study area數(shù)據(jù)來源本文使用的基礎(chǔ)數(shù)據(jù)包括:CGIAR-CSI(1) 國際農(nóng)業(yè)研究磋商小組空間信息委員會(huì), /, 訪問日期2010年7月8日1)提供的90m SRTM-DEM;中國西部生態(tài)和環(huán)境科學(xué)數(shù)據(jù)中心(2) 中國西部生態(tài)和環(huán)境科學(xué)數(shù)據(jù)中心, , 訪問日期2010年7月8日2)提供的1:10萬土地利用圖;美國宇航局NASA(3) 美國宇航局, HYPERLINK /api/ /api/, 訪問日期2010年7月8日3)提供的30m Landsat5 TM遙感影像(2009.8.11);NASA提供的10a(2000年至2009年)MODIS(中分辨率成像光譜儀)歸一化植被指數(shù)

10、(NDVI)產(chǎn)品,其空間分辨率為250m,時(shí)間分辨率是16d合成;NASA提供的6a(2003年至2008年)MODIS逐日地表溫度數(shù)據(jù),其空間分辨率為1km。選用的73個(gè)土壤樣本數(shù)據(jù)( REF _Ref266392412 h * MERGEFORMAT 圖1)是在2009年在研究區(qū)開展的凍土本底調(diào)查工作中獲得(4) 青藏高原多年凍土本底調(diào)查,科技部基礎(chǔ)性工作專項(xiàng),編號(hào)2008FY110200,2007.12 2012.12。調(diào)查中詳細(xì)記錄了土層和土壤剖面信息、土壤屬性信息(顏色、質(zhì)地、結(jié)構(gòu)等)、地形地貌信息等,并結(jié)合實(shí)驗(yàn)室分析數(shù)據(jù),確定各樣本點(diǎn)的土壤類型。樣本中高山寒漠土有4個(gè)、高山漠土6個(gè)

11、,高山草甸土和高山草原土分別為41和22個(gè)。由于研究區(qū)處于山地丘陵地帶,受交通不便和地理?xiàng)l件的限制,在瑪日塘區(qū)域( REF _Ref266392412 h * MERGEFORMAT 圖1,左上角)沒有布設(shè)土壤采樣點(diǎn),從空間上看采樣點(diǎn)分布具有不均勻性。采樣點(diǎn)大多分布青藏公路沿線。采樣點(diǎn)的設(shè)計(jì)遵循以下原則:首先沿青康公路均勻分布,再根據(jù)海拔、坡度、坡向、凍土大致分布等信息進(jìn)行調(diào)整,在野外具體工作時(shí)結(jié)合觀察到的植被、土壤情況、可達(dá)性進(jìn)一步微調(diào)整。這種結(jié)合專家知識(shí)的采樣方案在一定程度上彌補(bǔ)了空間不均勻采樣造成的代表性不足的問題17。支持向量機(jī)(SVM)SVM算法的基本原理是確定一個(gè)能將兩個(gè)類別的樣本

12、正確分類且使分類間隔最大的最優(yōu)分類超平面( REF _Ref265937674 h * MERGEFORMAT 圖2)。按照Vapnik18的描述方法,線性SVM可以定義為:若樣本集是線性可分的,則存在分類超平面,對樣本集中任一都滿足: (1)即(2)式中,為定義在多維空間(為維數(shù))中的樣本點(diǎn),定義了樣本點(diǎn)的類別。向量垂直于分類超平面稱為權(quán)重,決定超平面的方向。為閾值決定超平面的位置。圖 SEQ 圖 * ARABIC 2完全線性可分的SVM超平面19Fig. SEQ Fig. * ARABIC 2 Linearly separating SVM hyperplane for the separ

13、able case19尋找分類間隔最大的最優(yōu)超平面問題可表述為:(3)使得,(4)解此最優(yōu)化問題可得線性可分的SVM判別函數(shù):(5)式中,為支持向量個(gè)數(shù),0為拉格朗日乘子。在實(shí)際應(yīng)用中通常存在一條直線或者線性的分類面不能把兩類樣本完全區(qū)分開的情況。為了解決這一問題,需在式(3)、式(4)中加入一個(gè)松弛項(xiàng),以獲得滿足分類間隔較大誤分樣本較小的分類超平面。目標(biāo)函數(shù)就變成(6)使得,(7)式中,為懲罰因子,用來對訓(xùn)練錯(cuò)誤進(jìn)行懲罰,實(shí)現(xiàn)在錯(cuò)分樣本的比例和算法復(fù)雜度之間的折衷。當(dāng)樣本非線性可分時(shí)需要用一個(gè)映射把樣本從一個(gè)空間映射到另一個(gè)高維的空間,在這個(gè)高維空間中樣本線性可分。此時(shí)非線性可分的SVM的判

14、別函數(shù)為:(8)式中,是核函數(shù),它使支持向量機(jī)可以在高維空間中對變換后的樣本使用線性分類的方法進(jìn)行分類。常用的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯徑向基核函數(shù)()和二次神經(jīng)網(wǎng)絡(luò)核函數(shù)。SVM解決多類別分類問題主要有兩種方式:一對多法(one-against-all,OAA)和一對一法(one-against-one,OAO)。OAA方法依次用一個(gè)兩類分類器將每一類與其它所有類別區(qū)分開,對于n個(gè)類別的樣本,有n個(gè)分類函數(shù)。分類時(shí)將未知樣本分類為具有最大分類函數(shù)值的那類。OAO方法在每兩類間訓(xùn)練一個(gè)分類器,對于一個(gè)n類問題,有n(n-1)/2個(gè)分類函數(shù)。將這些分類函數(shù)應(yīng)用于一個(gè)未知樣本,有n(n

15、-1)/2個(gè)分類結(jié)果,結(jié)果中出現(xiàn)頻率最高的類別作為該未知樣本的類別。OAA和OAO兩種方法都是通過向二分類問題的轉(zhuǎn)化來解決多類別分類問題。本文采用高斯徑向基核函數(shù)和OAO的分類方式。高斯徑向基核函數(shù)能處理土壤類別和環(huán)境變量間的非線性關(guān)系且只需確定一個(gè)核函數(shù)參數(shù)(5) .tw/cjlin/papers/guide/guide.pdf, 訪問日期2010年6月29日5)。核函數(shù)中的參數(shù)和懲罰因子通過交叉驗(yàn)證方式確定。據(jù)經(jīng)驗(yàn)OAO方法比OAA有更好的分類結(jié)果20,且能減小由于樣本數(shù)據(jù)不均衡帶來的影響21。SVM土壤分類SVM數(shù)據(jù)前處理本工作是在90m分辨率的基礎(chǔ)上進(jìn)行的,出于SVM分類時(shí)對數(shù)據(jù)一致性

16、的要求,需將不同分辨率的遙感數(shù)據(jù)統(tǒng)一重采樣,方法采用最鄰近法。本文使用臺(tái)灣大學(xué)開發(fā)的LibSvm(6) HYPERLINK .tw/cjlin/libsvm/,訪問日期:2010 .tw/cjlin/libsvm/,訪問日期:2010年6月29日6),樣本數(shù)據(jù)從文本文件中讀取。數(shù)據(jù)文件格式如下:: 其中表示樣本,用整數(shù)值代替。、是變量的序列號(hào),從1開始。、是變量對應(yīng)的值。每一行表示一個(gè)樣本點(diǎn)的信息。對于非數(shù)值變量如土地利用,每一類可以一組值為-1和1的向量表示。例如三種土地利用類型可用如下方式表示:高覆蓋草地(-1,1,1),裸土地(1,-1,1),灌木林地(1,1,-1)。為了減少變量值大小

17、對分類精度的影響和降低計(jì)算量,本研究中對數(shù)據(jù)進(jìn)行歸一化處理,LibSvm采用線性歸一化方法,將數(shù)據(jù)歸一成-1,1。土壤分類潛在變量以成土因素學(xué)說和土壤景觀模型理論為基礎(chǔ),篩選SVM土壤分類模型潛在變量。土壤景觀模型理論認(rèn)為,具體的環(huán)境因子組合下很可能形成特定的土壤類型22,因此本研究篩選反映地理位置、地形地貌、氣候、水文、植被、人為因素等成土相關(guān)環(huán)境因子??紤]到青藏高原凍土環(huán)境的特殊性,植被和地表溫度對于凍土分布和凍土區(qū)土壤類型的指示可能具有季節(jié)性,植被指數(shù)和地表溫度分解出分期或者分季變量。潛在變量列于 REF _Ref263350474 d h * MERGEFORMAT 表1。詳細(xì)考慮介紹

18、如下。地形和植被能有效的體現(xiàn)土壤的空間分布,在土壤類型判別中起重要作用。在山區(qū),海拔、坡度、坡向是影響土壤形成的重要因素,它們通過改變水熱條件和植被狀況,間接改變土壤的組成成分和理化性質(zhì),影響土壤的發(fā)育。平面曲率和剖面曲率分別影響著物質(zhì)和能量流動(dòng)的加速集中或減速分散3。地形濕度指數(shù)能有效地指示土壤內(nèi)水分運(yùn)動(dòng)和土壤相對含水量23,24。植被類型與土壤類型關(guān)系密切,凋落物、草根等直接影響土壤形成,同時(shí)隨著土壤性質(zhì)的變化,又能促使植被類型發(fā)生變化。利用10a(2000年至2009年)MODIS NDVI數(shù)據(jù)表示植被分布,分解成兩種形式:其一,10a NDVI平均;其二,10a NDVI分期平均即MO

19、DIS NDVI數(shù)據(jù)一年分23期,一期為16d最大值合成,將10a NDVI數(shù)據(jù)分期進(jìn)行平均。為期6a(2003年至2008年)MODIS地表溫度作為影響土壤形成的氣候因素分兩種形式:其一,6a地表溫度平均;其二,6a地表溫度分冷暖季平均,即按照湯懋倉25青藏高原冷暖季的劃分標(biāo)準(zhǔn)(9月至4月為冷季,5月至8月為暖季),分別求兩時(shí)期6a地表溫度的平均值。由DEM計(jì)算得到的年太陽潛在直接輻射雖不是實(shí)測值,但能正確表明太陽輻射的空間差異,指示凍土分布情況。將離河流、湖泊的距離作為水限制因素,C. Hahn11曾有運(yùn)用,并取得了較好的分類結(jié)果。TM波段比值5:7(b5b7)代表粘土含量,5:3(b5b

20、3)和3:1(b3b1)反映鐵的相對濃度26,此三種波段比值對區(qū)分地表物質(zhì)組成有重要作用。坐標(biāo)雖然不是其中的成土因素,但其能增強(qiáng)SVM對土壤空間分布的判斷,以提高分類精度。土地利用作為人為因素,較好地反映人類活動(dòng)的影響。表 SEQ 表 * ARABIC 1 研究區(qū)支持向量機(jī)(SVM)潛在變量 Table SEQ Tab. * ARABIC 1 Potential variables of SVM for the soil classification變量 Variables分辨率Resolution范圍 Range成土因素1)Factors高程, 坡度, 坡向Altitude/Slope/As

21、pect90m34305300m,041,0360(平坦區(qū)為-1, -1 for flat zones)R離河流的距離Distance to river017879mH離湖泊的距離Distance to lake045407mH坐標(biāo)Coordinates90m35.235.7N, 99.199.6E土地利用Land use1:100,0006類 (6 classes)HF10a NDVI平均Mean NDVI of 10 years250m-11V,O10a NDVI分期平均Average 16d NDVIs in 10 years250m-11V,O平面曲率, 剖面曲率Plane curva

22、ture/profile curvature90m-11, -1.11.2R地形濕度指數(shù)Topographic wetness index90m4.523R,HTM波段比值(5:7,5:3,3:1)Band ratio of TM30m0255 DNO,PM6a地表溫度平均Mean surface temperature of 6 years1km-2.75.6CL6a地表溫度冷暖季平均Seasonal mean surface temperature of 6 years (warm and cold)1km暖1.312.2,冷 -6.42.5(1.312.2 in warm season,

23、 -6.42.5 in cold season)CL年潛在直接太陽輻射Annual potential direct solar radiation90m11050242628946 WH/m2CL,V1)R:地形Relief;H:水文Hydrology;PM:母質(zhì)Parent material;CL:氣候Climate;V:植被Vegetation;O:有機(jī)物Organic matter;HF:人為因素Human factor確定分類變量成土環(huán)境因素有不同的地區(qū)性組合,對于不同的地區(qū),往往某一種或幾種因素起主導(dǎo)作用27,因此從潛在變量列表中確定合適的分類變量是個(gè)大量嘗試和驗(yàn)證的過程。 REF

24、 _Ref262498632 h * MERGEFORMAT 表2列出了本研究建立的六組變量組合。McBratney等28對近60a數(shù)字土壤推理方法進(jìn)行綜述,發(fā)現(xiàn)80的研究將地形作為主要預(yù)測因子,25將植被作為重要預(yù)測因子考慮。C. Hahn等11曾在SVM變量組合中加入了和河流湖泊的距離、土地利用和坐標(biāo)并取得了較好的結(jié)果。鑒于此有變量組合A和B??紤]到其它成土因素對土壤分類的影響,C、D中增加了代表氣候的地表溫度變量,E中增加了代表地表物質(zhì)組成的TM波段比值變量。太陽輻射雖是氣候因素,但其已經(jīng)間接體現(xiàn)在植被指數(shù)、地表溫度等上,因此將其作為單獨(dú)指標(biāo)加入F中。A和B、C和D的比較反映NDVI、地

25、表溫度不同表現(xiàn)形式對分類精度的影響。表 SEQ 表 * ARABIC 2 輸入的變量組合Table SEQ Tab. * ARABIC 2 Combinations of input variables to SVM組號(hào) Group ID輸入變量 Input variablesA基礎(chǔ)變量1),10a NDVI平均Basic variables; Mean NDVI of 10 yearsB基礎(chǔ)變量,10a NDVI分期平均Basic variables; Average 16d NDVIs of 10 yearsC基礎(chǔ)變量,10a NDVI平均,6a 地表溫度冷暖季平均Basic variab

26、les; Mean NDVI of 10 years; Seasonal mean surface temperature of 6 yearsD基礎(chǔ)變量,10a NDVI平均,6a 地表溫度平均Basic variables; Mean NDVI of 10 years; Mean surface temperature of 6 yearsE基礎(chǔ)變量,10a NDVI平均, 6a 地表溫度冷暖季平均, TM波段比值(5:7,5:3,3:1)Basic variables; Mean NDVI of 10 years; Seasonal mean surface temperature of

27、 6 years; Band ratio of TM(5:7,5:3,3:1)F基礎(chǔ)變量,10a NDVI平均,6a 地表溫度冷暖季平均,TM波段比值(5:7,5:3,3:1),年潛在直接太陽輻射Basic variables; Mean NDVI of 10 years; Seasonal mean surface temperature of 6 years; Band ratio of TM(5:7,5:3,3:1); Annual potential direct solar radiation1)基礎(chǔ)變量包括:高程,坡向,坡度,離河流的距離,離湖泊的距離,緯度,經(jīng)度,土地利用,剖面曲

28、率,平面曲率,地形濕度指數(shù) (Basic variables include altitude, aspect, slope, distance to river, distance to lake, latitude, longitude, land use, profile curvature, plane curvature, topographic wetness index)精度評(píng)價(jià)方法研究區(qū)內(nèi)缺少大比例尺(如1:10萬)的土壤類型圖,無法對本文模擬結(jié)果進(jìn)行直接驗(yàn)證。本文采用交叉驗(yàn)證方法,K(K3)重交叉驗(yàn)證可以有效地避免過學(xué)習(xí)和欠學(xué)習(xí)狀態(tài)的發(fā)生??傉{(diào)查樣點(diǎn)為73個(gè),采用5重交叉驗(yàn)證

29、,將73個(gè)樣本點(diǎn)隨機(jī)分解為5份,將其中58個(gè)點(diǎn)作為訓(xùn)練樣本,15個(gè)點(diǎn)作為驗(yàn)證樣本,反復(fù)驗(yàn)證5次。結(jié)果與討論 REF _Ref266449307 h * MERGEFORMAT 圖3、 REF _Ref264621400 h * MERGEFORMAT 表3分別是 REF _Ref262498632 h * MERGEFORMAT 表2不同變量組合下的土壤類型分布模擬圖和精度評(píng)價(jià)結(jié)果。從結(jié)果圖3a和圖3b中可以看出變量組合A明顯優(yōu)于B,B幾乎不能預(yù)測出高山漠土和高山寒漠土,精度評(píng)價(jià)結(jié)果同樣證明,NDVI完全平均(A)比分期平均(B)更適用于凍土區(qū)土壤分類。圖 SEQ 圖 * ARABIC 3不同

30、變量組合SVM土壤分類成果圖Fig. SEQ Fig. * ARABIC 3 Simulated SVM soil type maps with different variable combinations 表 SEQ 表 * ARABIC 3 不同變量組合SVM土壤分類精度Table SEQ Tab. * ARABIC 3 Accuracy of SVM soil classification with different variable combinations 組號(hào) Group ID5重交叉驗(yàn)證精度()5-fold cross-validation accuracy (%)A46.7

31、53.3606066.7B46.753.353.353.360C606066.773.373.3D4053.353.36066.7E6066.773.38080F6066.766.773.380在結(jié)果圖3d中發(fā)現(xiàn)有條帶狀明顯錯(cuò)分現(xiàn)象且與結(jié)果圖3a、圖3c相比其高山寒漠土相對過多。比較結(jié)果圖3c和圖3a,圖3c有明顯改善,如圖3c中圈出區(qū)域。根據(jù)專家經(jīng)驗(yàn)此處應(yīng)為原始高山草甸土(高山草甸土的亞類),因其地勢相對低洼且鄰近亞冰雪帶,水分條件較好,但海拔較高(4500m左右),氣溫較低,寒凍風(fēng)化強(qiáng)烈,生物作用微弱,適合此種土壤的發(fā)育。在比較變量組合A、C和D三組分類精度時(shí),發(fā)現(xiàn)C最優(yōu)D最差。因此有以下

32、兩條結(jié)論:地表溫度分季平均(C)比全年平均(D)在本研究區(qū)有更好的分類結(jié)果;增加地表溫度分季平均變量會(huì)提升土壤判別能力,增加地表溫度全年平均變量則反之。究其原因可能是青藏高原冷暖季溫差大,不同時(shí)期有不同成土過程,將地表溫度分季平均會(huì)為土壤判別提供更多信息,而全年平均則提供一些噪音信息。比較變量組合E和C的分類精度,E在C的基礎(chǔ)上有較大提升。據(jù)西藏土壤29的描述,研究區(qū)內(nèi)四類土壤地表有機(jī)質(zhì)含量有較大差異,按由高到低次序排列依次為高山草甸土、高山草原土、高山漠土、高山寒漠土。TM波段比值成為捕獲此差異的關(guān)鍵變量。比較變量組合F和E的結(jié)果圖、分類精度發(fā)現(xiàn)兩者比較接近,分析其原因可能是太陽輻射同植被和

33、地表溫度狀況有密切聯(lián)系,對土壤分類的貢獻(xiàn)可能已經(jīng)從植被和地表溫度指標(biāo)上得以體現(xiàn)。綜上分析,變量組合E是溫泉典型凍土區(qū)較合適的變量組合?;诖诉M(jìn)行的SVM土壤分類,5重交叉驗(yàn)證精度最低為60,最高為80,平均為72。對比美國傳統(tǒng)的大比例尺土壤圖大約為5060的精度30,本方法達(dá)到較好的分類精度。變量組合E的驗(yàn)證結(jié)果分析發(fā)現(xiàn),高山漠土和高山寒漠土的預(yù)測結(jié)果較差,高山草原土容易誤分為高山草甸土。據(jù)樣點(diǎn)資料和專家經(jīng)驗(yàn),位于高山的亞冰雪帶如圈出區(qū)域,分布有寒漠土,然而此處卻預(yù)測為草原土,寒漠土零星分布其中。在所有的誤分結(jié)果中,高山草原土誤分為高山草甸土占48;在高山草原土誤分結(jié)果中,誤分為高山草甸土占9

34、0,高山草原土誤分為高山草甸土概率較高。由于樣點(diǎn)比例不均衡( REF _Ref276926336 h 表4),導(dǎo)致SVM對高山漠土和高山寒漠土訓(xùn)練不充分,對高山草甸土存在相對過學(xué)習(xí)情況,可能是造成上述現(xiàn)象的主要原因。列出了5重交叉驗(yàn)證時(shí)訓(xùn)練樣本各土壤類型構(gòu)成情況。表 SEQ 表 * ARABIC 4 五重交叉驗(yàn)證中不同土壤類型的訓(xùn)練樣本構(gòu)成比例Table SEQ Tab. * ARABIC 4 Proportion of training samples of soil types in the 5-fold cross-validation標(biāo)識(shí)Number高山草甸土Alpine meadow

35、 soil高山草原土Alpine steppe soil高山漠土Alpine desert soil高山寒漠土Frigid desert soil13517422331843334165343317445321853結(jié) 論本文以青藏高原季節(jié)凍土和多年凍土過渡典型區(qū)溫泉區(qū)為研究案例,提供了一種適用于凍土區(qū)的土壤制圖方法。該方法基于支持向量機(jī),在沒有大量樣本點(diǎn)的地區(qū)也可以較為準(zhǔn)確地模擬土壤類型分布。通過溫泉典型凍土區(qū)案例研究,本研究依托土壤-景觀模型,確定了該區(qū)的變量組合,即高程、坡向、坡度、離河流、湖泊的距離、緯度、經(jīng)度、土地利用類型、剖面曲率、平面曲率、地形濕度指數(shù)、多年NDVI平均、多年地表

36、溫度冷暖季平均,以及TM波段比值(5:7,5:3,3:1)。5重交叉精度驗(yàn)證表明,精度最低為60,最高為80,平均為72,達(dá)到較好的分類精度。同時(shí)隨著研究區(qū)訓(xùn)練樣本數(shù)量的增多,有望進(jìn)一步提升分類精度。本研究說明了基于支持向量機(jī)的土壤分類方法是預(yù)測性土壤制圖的一種有效方法。在實(shí)際應(yīng)用中也反映出SVM的一個(gè)問題,即不能很好的處理樣本點(diǎn)比例失衡的情況。對于樣點(diǎn)過少的類分類精度較差,樣點(diǎn)相對較多的類分類精度較好,但有可能出現(xiàn)過學(xué)習(xí)的現(xiàn)象。鑒于此在調(diào)查采樣前應(yīng)設(shè)計(jì)有目的的采樣方案。由于SVM變量均可以從遙感產(chǎn)品和DEM上獲取,SVM模擬結(jié)果可作為野外調(diào)查參考,有目的選擇更多有代表性的樣本點(diǎn),減少不必要的

37、冗余樣本點(diǎn),既可提高野外工作的質(zhì)量和效率,又能提升土壤分類精度。對于廣袤的青藏高原,土壤類型豐富,凍融過程和物候條件復(fù)雜。本文選取的環(huán)境變量是否適用于其它凍土區(qū)乃至整個(gè)青藏高原,還需要更多的驗(yàn)證。下一步工作將結(jié)合2010年青藏高原改則區(qū)野外調(diào)查成果,把SVM分類方法和選取的變量應(yīng)用到改則區(qū),以探求此方法的廣泛適用性。參考文獻(xiàn)1陳杰, 龔子同, 陳志誠, 等. 基于國際凍土分類進(jìn)展論中國土壤系統(tǒng)分類中凍土綱的恢復(fù)與重構(gòu). 土壤, 2005, 37(5): 311.Chen J, Gong Z T, Chen Z, et al. Suggestions for resumption and rec

38、onstruction of Chinese cryosol classification based on recent international progress in cryosol classification(In Chinese). Soils, 2005, 37(5):3112顧國安, 張累德, 張百平. 喀喇昆侖山昆侖山地區(qū)土壤. 北京: 中國環(huán)境科學(xué)出版社, 2000: 1181.Gu G A, Zhang L D, Zhang B P. Soil geography of the Karakorum-Kunlun mountains(In Chinese). Beijin

39、g:China Environmental Science Press,2000:11813孫孝林, 趙玉國, 秦承志, 等. DEM柵格分辨率對多元線性土壤景觀模型及其制圖應(yīng)用的影響. 土壤學(xué)報(bào), 2008, 45(5): 971977.Sun X, Zhao Y Q, Li C, et al. Effects of DEM resolution on multi-factor linear soil-landscape models and their application in predictive soil mapping(In Chinese). Acta Pedologica S

40、inica, 2008, 45(5):9719774孫孝林, 趙玉國, 趙量, 等. 應(yīng)用土壤-景觀定量模型預(yù)測土壤屬性空間分布及制圖. 土壤, 2008, 40(5): 837842.Sun X L, Zhao Y G, Zhao L, et al. Prediction and Mapping of Spatial Distribution of Soil Attributes by Using Soil-Landscape Models(In Chinese). Soils, 2008, 40(5):8378425Scull P, Franklin J, Chadwick O A. Th

41、e application of classification tree analysis to soil type prediction in a desert landscape. Ecological Modelling, 2005, 181(1): 1156Zhu A X. A similarity model for representing soil spatial information. Geoderma, 1997, 77(2-4): 2172427王棟, 曾洪詳, 戰(zhàn)守義, 等. 基于SVM分類機(jī)的移動(dòng)通信欺詐檢測系統(tǒng). 計(jì)算機(jī)工程與設(shè)計(jì), 2004, 25(6): 859

42、861.Wang D, Zeng H X, Zhan S Y, et al. Fraud detection system in mobile communication networks based on SVM(In Chinese). Computer Engineering and Design, 2004, 25(6):8598618蔣蕓, 李戰(zhàn)懷. 基于改進(jìn)的SVM分類器的醫(yī)學(xué)圖像分類新方法. 計(jì)算機(jī)應(yīng)用研究, 2008, 25(1): 5355.Jiang Y, Li Z. New medical image classify approach based on improved

43、 SVM classifier(In Chinese). Application Research of Computers, 2008, 25(1):53559Parikh U B, Das B, Maheshwari R. Fault classification technique for series compensated transmission line using support vector machine. International Journal of Electrical Power & Energy Systems, 2010, 32(6): 62963610Sat

44、tlecker M, Bessant C, Smith J, et al. Investigation of support vector machines and Raman spectroscopy for lymph node diagnostics. Analyst, 2010, 135(5): 89590111Hahn C, Gloaguen R. Estimation of soil types by non linear analysis of remote sensing data. Nonlinear Processes in Geophysics, 2008, 15(1):

45、 11512612Raudys S. Dimensionality, sample size, and classification error of nonparametric linear classification algorithms. IEEE Transactions On Pattern Analysis and Machine Intelligence, 1997, 19(6): 66767113Cortijo F J, De la Blanca N P. The performance of regularized discriminant analysis versus

46、non-parametric classifiers applied to high-dimensional image classification. International Journal of Remote Sensing, 1999, 20(17): 3345336514楊琳, 朱阿興, 李寶林, 等. 應(yīng)用模糊c均值聚類獲取土壤制圖所需土壤-環(huán)境關(guān)系知識(shí)的方法研究. 土壤學(xué)報(bào), 2007, 44(5): 784791.Yang L, Zhu A L, Qin B, et al. Extraction of knowledge about soil-environment rela

47、tionship for soil mapping using fuzzy c-means(FCM) clustering(In Chinese). Acta Pedologica Sinica, 2007, 44(5):78479115陳孝全, 茍新京. 三江源自然保護(hù)區(qū)生態(tài)環(huán)境. 西寧: 青海人民出版社, 2002: 1240.Chen X Q, Gou X J. Ecological environment in the source of the Three Rivers nature reserve(In Chinese). Xining:Qinghai Peoples Press,

48、2002:124016王文富, 席承藩. 中國土壤. 北京: 中國農(nóng)業(yè)出版社, 1998: 11253.Wang W F, Xi C P. Soils of China(In Chinese). Beijing:China Agriculture Press,1998:1125317Weindorf D C. Spatial Variability of Soil Properties at Capulin Volcano,New Mexico,USA:Implications for Sampling Strategy. Pedosphere, 2010, (2): 18519718Vapn

49、ik V N. The nature of statistical learning theory. 2nd ed. New York: Springer, 2000. 1 314.19Burges C. A tutorial on Support Vector Machines for pattern recognition. Data Mining and Knowledge Discovery, 1998, 2(2): 12116720Pal M, Mather P M. Support vector machines for classification in remote sensi

50、ng. International Journal of Remote Sensing, 2005, 26(5): 1007101121Huang C, Davis L S, Townshend J. An assessment of support vector machines for land cover classification. International Journal of Remote Sensing, 2002, 23(4): 72574922Hudson B D. The Soil Survey as Paradigm-based Science. Soil Scien

51、ce Society America Journal, 1992, 56(3): 83684123Florinsky I V, Eilers R G, Manning G R, et al. Prediction of soil properties by digital terrain modelling. Environmental Modelling & Software, 2002, 17(3): 29531124鄧慧平, 李秀彬. 地形指數(shù)的物理意義分析. 地理科學(xué)進(jìn)展, 2002, 21(2): 103110.Deng H P, Li X B N N, Nantong C, et

52、al. Relationship of Upslope Contribution Area and Soil Water Content in TOPMODEL(In Chinese). Progress In Geography, 2002, 21(2):10311025湯懋蒼, 鐘海玲, 李棟梁. 青藏鐵路沿線的四季劃分及其溫度變化分析. 高原氣象, 2003, 22(5): 440444.Tang M C, Zhong H L, Li D L C A, et al. The Standard of Marking off the Four Seasons along Qinghai-Xi

53、zang Railway and Its Temperature Variation Analysis(In Chinese). Plateau Meteorology, 2003, 22(5):44044426Vincent R K. Fundamentals of geological and environmental remote sensing. Upper Saddle River, NJ: Prentice Hall, 1997. 1 366.27劉峰, 朱阿興, 李寶林, 等. 利用陸面反饋動(dòng)態(tài)模式來識(shí)別土壤類型的空間差異. 土壤通報(bào), 2009, 40(3): 501508.Liu F, Zhu A X, Li B L, et al. Identification of Spatial Difference of Soil Types Using Land Surface Feedback Dynamic Patterns(In Chinese). Chinese Journal of Soil Science, 2009, 40(3):50150828Mcbratney

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論