空間數(shù)據(jù)分析模型_第1頁
空間數(shù)據(jù)分析模型_第2頁
空間數(shù)據(jù)分析模型_第3頁
空間數(shù)據(jù)分析模型_第4頁
空間數(shù)據(jù)分析模型_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

空間數(shù)據(jù)分析模型7.1空間數(shù)據(jù)

按照空間數(shù)據(jù)的維數(shù)劃分,空間數(shù)據(jù)有四種基本類型:點數(shù)據(jù)、線數(shù)據(jù)、面數(shù)據(jù)和體數(shù)據(jù)。

點是零維的。從理論上講,點數(shù)據(jù)可以是以單獨地物目標的抽象表達,也可以是地理單元的抽象表達。這類點數(shù)據(jù)種類很多,如水深點、高程點、道路交叉點、一座城市、一個區(qū)域。

線數(shù)據(jù)是一維的。某些地物可能具有一定寬度,例如道路或河流,但其路線和相對長度是主要特征,也可以把它抽象為線。其他的線數(shù)據(jù),有不可見的行政區(qū)劃界,水陸分界的岸線,或物質(zhì)運輸或思想傳播的路線等。

面數(shù)據(jù)是二維的,指的是某種類型的地理實體或現(xiàn)象的區(qū)域范圍。國家、氣候類型和植被特征等,均屬于面數(shù)據(jù)之列。

真實的地物通常是三維的,體數(shù)據(jù)更能表現(xiàn)出地理實體的特征。一般而言,體數(shù)據(jù)被想象為從某一基準展開的向上下延伸的數(shù),如相對于海水面的陸地或水域。在理論上,體數(shù)據(jù)可以是相當(dāng)抽象的,如地理上的密度系指單位面積上某種現(xiàn)象的許多單元分布。

在實際工作中常常根據(jù)研究的需要,將同一數(shù)據(jù)置于不同類別中。例如,北京市可以看作一個點(區(qū)別于天津),或者看作一個面(特殊行政區(qū),區(qū)別于相鄰地區(qū)),或者看作包括了人口的“體”。

7.2空間數(shù)據(jù)分析

空間數(shù)據(jù)分析涉及到空間數(shù)據(jù)的各個方面,與此有關(guān)的內(nèi)容至少包括四個領(lǐng)域。

1)空間數(shù)據(jù)處理??臻g數(shù)據(jù)處理的概念常出現(xiàn)在地理信息系統(tǒng)中,通常指的是空間分析。就涉及的內(nèi)容而言,空間數(shù)據(jù)處理更多的偏重于空間位置及其關(guān)系的分析和管理。

2)空間數(shù)據(jù)分析??臻g數(shù)據(jù)分析是描述性和探索性的,通過對大量的復(fù)雜數(shù)據(jù)的處理來實現(xiàn)。在各種空間分析中,空間數(shù)據(jù)分析是重要的組成部分。空間數(shù)據(jù)分析更多的偏重于具有空間信息的屬性數(shù)據(jù)的分析。

3)空間統(tǒng)計分析。使用統(tǒng)計方法解釋空間數(shù)據(jù),分析數(shù)據(jù)在統(tǒng)計上是否是“典型”的,或“期望”的。與統(tǒng)計學(xué)類似,空間統(tǒng)計分析與空間數(shù)據(jù)分析的內(nèi)容往往是交叉的。

4)空間模型??臻g模型涉及到模型構(gòu)建和空間預(yù)測。在人文地理中,模型用來預(yù)測不同地方的人流和物流,以便進行區(qū)位的優(yōu)化。在自然地理學(xué)中,模型可能是模擬自然過程的空間分異與隨時間的變化過程??臻g數(shù)據(jù)分析和空間統(tǒng)計分析是建立空間模型的基礎(chǔ)。

7.3空間數(shù)據(jù)分析的一些基本問題

空間數(shù)據(jù)不僅有其空間的定位特性,而且具有空間關(guān)系的連接屬性。這些屬性主要表現(xiàn)為空間自相關(guān)特點和與之相伴隨的可變區(qū)域單位問題、尺度和邊界效應(yīng)。傳統(tǒng)的統(tǒng)計學(xué)方法在對數(shù)據(jù)進行處理時有一些基本的假設(shè),大多都要求“樣本是隨機的”,但空間數(shù)據(jù)可能不一定能滿足有關(guān)假設(shè),因此,空間數(shù)據(jù)的分析就有其特殊性(David,2003)。

7.3.1空間自相關(guān)

空間自相關(guān)是空間位置上越靠近,事物或現(xiàn)象就越相似,即事物或現(xiàn)象具有對空間位置的依賴關(guān)系。如氣溫、濕度等的空間分布均體現(xiàn)了與海陸距離、海拔高程等的相關(guān)性。如果沒有空間自相關(guān),地理事物或地理現(xiàn)象的分布將是隨意的,地理學(xué)中的空間分異規(guī)律就不能體現(xiàn)出來。空間自相關(guān)性使得傳統(tǒng)的統(tǒng)計學(xué)方法不能直接用于分析地理現(xiàn)象的空間特征。因為傳統(tǒng)的統(tǒng)計學(xué)方法的基本假設(shè)就是獨立性和隨機性。為了分析具有空間自相關(guān)性的地理現(xiàn)象,需要對傳統(tǒng)的統(tǒng)計學(xué)方法進行改進與發(fā)展,空間統(tǒng)計學(xué)就應(yīng)運而生了。

如果我們想確定某個位置測定的屬性值是否合適,自相關(guān)分析將幫助我們記述已知的觀測位置在多大程度上是有用的。自相關(guān)有三種:正自相關(guān),負自相關(guān)和無相關(guān)(零自相關(guān))。正自相關(guān)是最常見的,指的是附近的觀察值很可能是彼此相似的;負自相關(guān)較少見,指的是附近的觀察值很可能是彼此不同的;零自相關(guān)指的是無法辨別空間效應(yīng),觀察值在空間上似乎是隨機變化的。區(qū)分這三種自相關(guān)是統(tǒng)計方法正確應(yīng)用的前提。

7.3.2可變區(qū)域單位問題

空間數(shù)據(jù)處理中存在的一個重要問題是空間范圍對空間分析的影響。大區(qū)域的數(shù)據(jù)可能來自小區(qū)域詳細數(shù)據(jù)的統(tǒng)計匯總。以國家級人口普查數(shù)據(jù)的統(tǒng)計匯總為例,人口調(diào)查以戶為單位進行,而產(chǎn)生的人口調(diào)查報告中的數(shù)據(jù)則是不同區(qū)域?qū)哟稳丝跀?shù)據(jù)匯總統(tǒng)計的結(jié)果。匯總單位與所研究的現(xiàn)象沒有任何關(guān)系,但是匯總單位影響著由基層單位產(chǎn)生的統(tǒng)計結(jié)果。

統(tǒng)計匯總的區(qū)域?qū)哟尾煌?,統(tǒng)計結(jié)果間的關(guān)系也就不同,這就產(chǎn)生了可變區(qū)域單位問題(modifiablearealunitproblem,MAUP)。如果在特定的研究中指定了不同的空間單位,觀察到的格局和關(guān)系可能有很大的差異。這個問題可以參考圖7.1。圖中使用了橫向和縱向兩種不同的匯總方法,形成了兩種不同的回歸分析結(jié)果,由此說明匯總單位對回歸方程和確定系數(shù)的影響是很明顯,回歸關(guān)系通過匯總得到了加強。事實上,利用同樣的數(shù)據(jù)通過不同的匯總方式可以使得相關(guān)系數(shù)在-1和1之間任意變化。

由匯總單位產(chǎn)生的影響有兩個。第一個影響與分析的空間范圍和匯總效應(yīng)有關(guān)。匯總之后的平均值更接近于回歸線,使得散點圖的結(jié)果更接近于線性,導(dǎo)致相關(guān)系數(shù)增加。一般通過匯總往往產(chǎn)生更好的擬合結(jié)果。第二個影響是不同匯總方法得到的結(jié)果實質(zhì)上是不同的。圖7.1可變區(qū)域單位問題7.3.3生態(tài)學(xué)謬誤

可變區(qū)域單位問題與更一般的統(tǒng)計問題——生態(tài)學(xué)謬誤相聯(lián)系。當(dāng)特定匯總層次的觀察值之間的統(tǒng)計關(guān)系假定可以接受,然后在更細的層次接受同樣關(guān)系的時候,就產(chǎn)生了這個問題。例如,在國家這個層次上,我們可能看到收入和犯罪之間有強烈的關(guān)系,即低收入往往伴隨著高犯罪。但是,如果我們據(jù)此認為低收入的人更可能干壞事,那就犯了生態(tài)學(xué)謬誤的錯誤。事實上,對于這樣的數(shù)據(jù),有效的精確的說法是:低收入國家傾向于經(jīng)歷較高的犯罪。是什么導(dǎo)致了這些觀察到的現(xiàn)象,可能有很大的差異:有可能是低收入地區(qū)治安很差,夜賊很多;或者是這些地區(qū)的人經(jīng)常酗酒;或者根本就與收入沒有關(guān)系。重要的是,高層次匯總數(shù)據(jù)中出現(xiàn)的關(guān)系應(yīng)該在底層匯總數(shù)據(jù)中重現(xiàn)并得到解釋。

這個問題很普遍。如果你關(guān)注新聞,在每天的日常生活或媒體中都可以發(fā)現(xiàn)生態(tài)學(xué)謬誤。犯罪率和死刑,槍支控制與關(guān)押率,車禍與車速限制等。不幸的是,生態(tài)學(xué)謬誤在學(xué)術(shù)界也不少見。這個問題經(jīng)常發(fā)生,其根本的原因可能是為了簡化解釋。事實上,特別在人文地理中,事情很少這么簡單。生態(tài)學(xué)謬誤和可變區(qū)域單位問題都要注意的是:統(tǒng)計關(guān)系會隨著匯總層次而發(fā)生變化。

7.3.4空間尺度

進行空間分析時,必須考慮空間尺度問題。不同對象的表現(xiàn)需要的不同尺度,例如,在大陸尺度,城市用點來表示。在區(qū)域尺度,城市用面來表示。在局部尺度,城市成為復(fù)雜的點、線、面和網(wǎng)絡(luò)的集合體。研究對象的空間尺度影響空間分析。因此,應(yīng)當(dāng)選定正確的或合適的空間尺度。

7.3.5空間非均一性和邊界效應(yīng)

區(qū)分空間分析與傳統(tǒng)統(tǒng)計分析的重要標志是空間的不均一性。例如,搜集到城區(qū)犯罪位置的數(shù)據(jù),并用點在地圖上標繪出來,就能可視化地表示犯罪的空間分布規(guī)律。在居住區(qū)和工作密集的地方,犯罪會有明顯的聚集性,在公園或道路的交叉口,可能會出現(xiàn)空缺。這些聚集或空缺只是城市內(nèi)部不均一性的一個結(jié)果。類似的問題是考慮疾病發(fā)生率的時候,必須考慮從事高風(fēng)險工作的人所在的位置。目前,處理這些問題的方法還很少。

邊界效應(yīng)是不均一問題的一個特殊類型。邊界效應(yīng)問題是指在研究區(qū)的中心位置,各個方向上的觀察值相接近;在研究區(qū)的邊界,只有研究區(qū)內(nèi)的觀察值才是相接近的。因此,確定適當(dāng)?shù)倪吔绮趴赡芊从硵?shù)據(jù)的真實性。

7.4空間數(shù)據(jù)的關(guān)系

空間數(shù)據(jù)中蘊涵了豐富的信息,本章僅考慮空間數(shù)據(jù)的位置屬性所能提供的信息。

重要的空間概念是:距離(distance)、鄰接(adjacency)和交互(interaction),與此密切相關(guān)的術(shù)語是近鄰(neighborhood)。在空間數(shù)據(jù)分析中,我們不僅對屬性數(shù)據(jù)的均值、方差等進行分析,也對空間上相聯(lián)系的實體的分布進行分析??臻g分布指的是空間實體之間的關(guān)系,可以通過距離、鄰接和交互分析,獲得對空間關(guān)系的認識。

7.4.1距離

在空間數(shù)據(jù)中,距離是空間實體間的直線距離或球面距離??臻g數(shù)據(jù)中的距離不同于數(shù)學(xué)上的距離(數(shù)學(xué)上的距離值兩個變量/樣本之間的距離,參閱模糊數(shù)學(xué)一章)。在小的地區(qū)(小尺度的研究),可以忽略地球曲率的影響,通常使用歐氏距離。對于空間上的兩個點i,j,其坐標分別為(xi,yi),(xj,yj),那么兩點之間的直線距離為:在較大的區(qū)域(大尺度研究),距離的計算要考慮地球的曲率。

除了直線距離外,實際應(yīng)用中也可按照道路、鐵路、河流或路網(wǎng)來計算距離;也可按照消耗的時間來計算距離。

7.4.2鄰接

鄰接可以認為是名義的、雙向的相等的距離。兩個空間實體,或者相鄰或者不相鄰,沒有中間狀態(tài)。確定相鄰有多種方式。最簡單的確定方式是,如果兩個實體在指定的空間距離內(nèi),那么它們是相鄰的,否則不相鄰。類似的,對于任一實體,確定出與其最相鄰的其他實體。我們也可以認為只有最鄰近的實體才是相鄰的。

與距離一樣,對鄰接的概念也可以進行擴展。鄰接的實體不一定是相近的。例如,就機場而言,在考慮上海、北京和莫斯科機場的鄰接關(guān)系時,可以認為上海機場與北京機場、北京機場與莫斯科機場是鄰接的,但上海機場與莫斯科機場則不鄰接的。

鄰接的概念主要應(yīng)用在空間自相關(guān)分析、空間插值和網(wǎng)絡(luò)分析中。

7.4.3交互

交互可以認為是距離和鄰接的綜合,它來自于一個基本的想法:近處的事物關(guān)系更密切。從數(shù)學(xué)上講,可將兩個空間實體之間的交互度表示為0(無交互)和1(高度交互)之間的數(shù)。鄰接也可以用類似的方式來表示,因為鄰接是雙向的。在空間分析中,典型的交互可用距離倒數(shù)加權(quán)來定義:其中,w是距離為d的兩個實體i,j之間的交互權(quán)重。k控制著權(quán)重的變化率。距離越近,權(quán)重越大,交互越強。

通用的交互計算中使用兩個實體的屬性值,例如人口的引力公式為:其中,pi,pj是i,j兩地的人口數(shù)量。

此外,也可以在公式中加入面積來定義兩個區(qū)域單位間的交互。

除了空間距離外,也可以使用其它的距離定義。例如,可以使用兩個國家的貿(mào)易量來定義交互程度。

7.4.4近鄰

近鄰有多種表達方式。例如,特定空間實體的近鄰是與該實體鄰接的其他空間實體的集合,此時,近鄰依賴于鄰接的定義。此外,可以不考慮鄰接性,將近鄰定義為空間上相聯(lián)系的區(qū)域,此時則需要使用距離的概念。近鄰的概念經(jīng)常被使用,主要是由于空間分布上鄰近的區(qū)域更為相似。這是一種內(nèi)部相似,不同于周邊區(qū)域。例如,考慮海拔高度,山是一種近鄰,其周圍的海拔都較高。圖7.2進一步揭示了這四個概念。左上角的圖指明了研究區(qū)內(nèi)A到其它點的距離。一般而言,總是可以確定兩點之間的距離。在右上角的圖中,按照距離指明了與A鄰接的兩點E和F。這種鄰接可以通過多種方法來定義。例如,以50米內(nèi)為鄰接的距離。注意,這種定義意味著D沒有鄰接的對象。我們也可以定義最近的對象是鄰接對象,這可以保證所有的對象都有兩個鄰接對象,雖然它同時意味著鄰接不再是對稱關(guān)系。例如,此時,D與E鄰接(最近的是C和E),但E并不鄰接D(與E最近的是A)。在左下角的圖中,使用線寬指明A與其它對象的交互作用強度。這里,交互是距離的倒數(shù),所以A與E交互作用強。在右下角的圖中,給出了對象A的兩個可能的近鄰,曲線內(nèi)是與A鄰接的對象,包括了A,E和F。另一個可能的近鄰是帶陰影的多邊形,該空間也接近于A。圖7.2距離、鄰接、交互和近鄰的概念7.5空間自相關(guān)分析

空間自相關(guān)分析包括全程空間自相關(guān)分析和局部空間自相關(guān)分析兩部分(GetisandOrd,1996),自相關(guān)分析的結(jié)果可用來解釋和尋找存在的空間聚集性或“焦點”。空間自相關(guān)分析需要的空間數(shù)據(jù)類型是點或面數(shù)據(jù),分析的對象是具有點/面分布特征的特定屬性。

全程空間自相關(guān)分析用來分析在整個研究范圍內(nèi)指定的屬性是否具有自相關(guān)性。局部空間自相關(guān)分析用來分析在特定的局部地點指定的屬性是否具有自相關(guān)性。具有正自相關(guān)的屬性,其相鄰位置值與當(dāng)前位置的值具有較高的一致性。

空間自相關(guān)分析,當(dāng)前常用的參數(shù)有三個,即Moran’sI,GearyC和G統(tǒng)計量

7.5.1Moran’sI參數(shù)

Moran’sI是應(yīng)用最廣的一個參數(shù),可用來進行全程空間自相關(guān)分析和局部空間自相關(guān)分析。全程空間自相關(guān)分析參數(shù)的定義是:Moran’s局部空間自相關(guān)分析參數(shù)的定義是:其中:

n是觀察值的數(shù)目,xi是在位置i的觀察值,Zi是xi的標準化形式。

,。{wij}是對稱的二項分布空間權(quán)重矩陣,在以樣點i為中心、距離為d的范圍內(nèi),取值為1,否則取值為0。

Moran’sI值越大,表明數(shù)據(jù)正的空間相關(guān)性越強。

7.5.2GerayC參數(shù)

GerayC參數(shù)用來分析局部空間相關(guān)性:作變換,C=1-C(d),C值大于0,表明正值四周為高值,小于0,則為低值,0則為無聚集特征。

7.5.3G統(tǒng)計量

G統(tǒng)計量由Ord和Getis1992年提出,1994年和1995年做了部分的修改,用來分析局部空間自相關(guān)性??臻g統(tǒng)計量Gi(d)定義為:

,

=Wi/(n-1),

,

;.

為了便于解釋,定義Gi(d)的標準化形式為:

i≠j,各變量的含義同上。

模擬表明(Ord和Getis1994),在原假設(shè)xi周圍不存在空間聚集的條件下,G的分布接近于正態(tài),所以,經(jīng)常借助于正態(tài)分布檢驗G值的顯著性。對于不同的觀察值N,在不同的顯著性概率(水平)下G值各不相同,例如,在0.1的顯著水平下,40個樣本對應(yīng)的G值為2.79,100個樣本對應(yīng)的G值為3.07。

檢驗顯著的G值說明位置i周圍是較高的數(shù)據(jù),即數(shù)據(jù)具有空間上的聚集性。

7.6空間變異分析

7.6.1空間變異

空間變異指研究對象在空間上的變化,它是地理學(xué)研究的基本問題??臻g變異的研究可借鑒空間分析的有關(guān)方法,通過對地理系統(tǒng)的特征進行分析,了解地理系統(tǒng)在空間上的分布和演替規(guī)律。圖7.3指導(dǎo)傳統(tǒng)地理制圖的概念模型空間變異是比較復(fù)雜的。降水、風(fēng)化、侵蝕、堆積、人類活動以及地球構(gòu)造運動等地球的內(nèi)外營力造成了物質(zhì)組成的空間變化,是導(dǎo)致空間變異最基本的原因。同時,地理系統(tǒng)的不同屬性隨時間發(fā)生變化,具有不同的時間變異性,而且這種變異性有可能超過空間變異,從而增加了空間變異研究的難度。

早期研究中,人們考慮到空間變異的復(fù)雜性以及有效研究工具的缺乏,往往通過定義系統(tǒng)分類單元和均質(zhì)制圖單元對空間變異進行系統(tǒng)分析,并假設(shè)所定義的空間單元由空間由均質(zhì)的(homogeneous)或接近均質(zhì)的塊段構(gòu)成,所有重要的變化都發(fā)生在邊界處(圖7.3)同樣,如果研究性質(zhì)的觀察值被直接地劃分為名義上的等級(例如植被中蓋度、土壤中的質(zhì)地),那么就很難考慮漸進的、單元內(nèi)的變異。

自20世紀70年代以來,隨著研究的深入,人們逐漸認識到了空間的一些特性。大量的實驗結(jié)果表明存在有不同尺度的空間變異。比如土壤的孔隙度,不僅隨地點變化,還隨采樣樣本的大小變化。極小空間范圍的變異或時間變異也可能導(dǎo)致不可預(yù)料的屬性測量值較大幅度的變化。大尺度的遙感研究,特別是使用紅外輻射研究裸地可以清楚地表現(xiàn)出地表的變異性。探地雷達研究則表明地表在垂向短距離內(nèi)也可以急劇地變異。

空間變異的程度依賴于過程的類型和它們在空間和時間中的協(xié)同關(guān)系。

7.6.2空間變異模型

考慮到地理過程對空間格局的影響,依據(jù)研究對象的空間分布形式劃分出兩種變異理論模型。

7.6.2.1常規(guī)模型

常規(guī)模型為突變模型(圖7.4a)。假定屬性在邊界處突然變化,但邊界之內(nèi)屬性變化很小。圖上單元由具有相似性質(zhì)的個體構(gòu)成,代表均質(zhì)的范圍,至少在分類系統(tǒng)的最低分類單位水平上相同(地圖上可辨別的最低分類單位與地圖的比例尺有關(guān),即與空間尺度有關(guān))。邊界可以通過采樣來確定,或者直接地通過空間特征(如坡形、坡位、植被變化)來確定,或者通過航片、衛(wèi)片上的相關(guān)特征來確定。

7.6.2.2

連續(xù)模型

連續(xù)模型(圖7.4b)假定屬性在空間逐漸變化,而且這種變化可以用數(shù)學(xué)模擬來逼近。

常規(guī)模型和連續(xù)模型在實際應(yīng)用中是不同的。以污染為例,如果污染水平高于某一臨界值,按照常規(guī)模型,就需要對整個地區(qū)進行凈化處理,這無疑是十分昂貴的。按照連續(xù)模型的觀點,污染常常是非均質(zhì)的,臨界位置上的采樣點在污染水平上差異甚大,可以采取統(tǒng)計方法來估計區(qū)域內(nèi)各個地方受污染的程度,這樣就可以有針對性的進行治理,從而節(jié)省大量資源。

變異模型可以通過確定性方法或隨機方法來逼近。確定性方法不承認屬性觀測值的不確定性,其結(jié)果是,連續(xù)模型認為性質(zhì)的變化是一個平穩(wěn)的可微分過程,而常規(guī)模型認為地理現(xiàn)象沒有內(nèi)部變異。隨機方法承認地理現(xiàn)象是一個復(fù)雜的自然體,必須通過采樣方法來研究,我們只能估計其屬性的量值而且這些估計受制于概率規(guī)則,即任何估計的準確性都只具有某種概率(圖7.4c、d、e、f)。用統(tǒng)計學(xué)語言來表達就是,每一個屬性Ai在每個圖上單元j中的數(shù)值都可以估計為Aij±e,其中e是一個正態(tài)分布的隨機誤差。上述兩種模型的進一步發(fā)展是不同類型的空間變異可以在不同尺度上發(fā)生(多尺度模型)。

實際上,空間變異研究中存在兩種明顯不同、但原理上互相聯(lián)系的觀點。一種是實用地、當(dāng)然地理解空間變異方式,認為觀察點位的數(shù)據(jù)可以外推到更大的區(qū)域。第二種是科學(xué)探求式的,認為形成過程導(dǎo)致自然和人為的分布形式的多樣性。但無論如何,過程的深入理解都有助于對空間分布形式作出合理的推斷。圖7.4空間變異的假想模型7.6.3空間數(shù)據(jù)插值

空間數(shù)據(jù)插值是進行數(shù)據(jù)外推的基本方法。常用的插值方法有:1)距離倒數(shù)插值(inverse

distanceweighted,IDW);2)樣條插值(spline);3)三角網(wǎng)插值;4)最小曲線法插值;5)等方位加權(quán)法插值;6)多項式擬合(趨勢面分析)插值;7)克里格插值(Kriging)?;跇颖局邓淼默F(xiàn)象和樣本點的空間分布方式,插值方法將生成與實際值相關(guān)性較好的預(yù)測值。不同的插值方法對于如何獲得最佳估計值都給予了一定的假設(shè),但無論你選哪種插值方法,樣本點越多,樣本點分布越均勻,插值結(jié)果越接近實際值。

7.7趨勢面分析

趨勢面分析的基本功能,是把空間中分布的一個具體的或抽象的曲面分解成兩部分:一部分主要由變化比較緩慢、影響遍及整個研究區(qū)的區(qū)域成分組成,稱為趨勢;另一部分是變化比較快,其影響在區(qū)內(nèi)并非處處可見的成分,稱為局部異常。趨勢面分析的實質(zhì)是進行數(shù)據(jù)的擬合,它對因變量無特別的要求,自變量一般總是由地理坐標(平面坐標,在特別的情況下,也可以用經(jīng)緯度)組成。在三維趨勢面分析中,則增加了高程或深度坐標值。

趨勢面分析實際是回歸分析的一種特殊應(yīng)用,或者說是回歸分析的一個變種。兩者在數(shù)學(xué)原理、計算步驟等方面幾乎完全相同,但是兩者在應(yīng)用上有較大的區(qū)別?;貧w分析的目的是研究變量之間的關(guān)系,并在此基礎(chǔ)上進行預(yù)報或建立回歸模型,趨勢面分析是要分離出區(qū)域趨勢和局部異常兩個成分。在實際應(yīng)用中,由于多項式函數(shù)對曲面擬合能力比較強,又由于地理上對擬合及分離的精度要求并不高,才使得趨勢面分析法得到廣泛的應(yīng)用。

從統(tǒng)計學(xué)中知道,回歸分析有幾個重要的假設(shè)條件,只有當(dāng)這些條件都基本上得到滿足之后,分析的結(jié)果在數(shù)學(xué)上才是精確可靠的,否則就可能產(chǎn)生虛假的結(jié)果。對于這些前提假設(shè),趨勢面分析可以嚴格地加以考慮,這時趨勢面分析實際就成為回歸分析,分析的目的,則是探討因變量和地理位置的關(guān)系。當(dāng)趨勢面分析不考慮,或部分地考慮這些前提假設(shè)時,分析目的就有別于回歸分析了。在趨勢面分析中,如果照搬回歸分析的上述假設(shè),可能一無所獲,而使局部異常的識別或分離無法實現(xiàn)。

7.7.1狹義趨勢面分析與廣義趨勢面分析

一般而言,趨勢面分析基本上僅限于Grant和Krumbein提出的多項式趨勢面分析法,即狹義的趨勢面分析。由于趨勢面分析的根本目的是要將觀測面所包含的信息分解為趨勢和局部異常兩個成分,而具有類似的或相同功能的方法還有許多,如滑動平均、滑動中值、克里格法、譜分析、自協(xié)方差分析及空間濾波等。這些方法不同于多項式趨勢面法,稱之為廣義的趨勢面分析法。

廣義趨勢面分析中,各種方法本來的功能并不僅僅局限于分離趨勢和局部異常,不同的方法各有其特殊的性質(zhì)。如滑動平均法主要是用以消除隨機干擾;克里格法是要在觀測數(shù)據(jù)的基礎(chǔ)上,對所分析的變量進行插值,并給出相應(yīng)的估計誤差;空間濾波則是根據(jù)情況,由分析者指定,分離出一定波長范圍內(nèi)的曲面組分。這些方法,或者要清除曲面中的一些組分,或者只提取曲面中的某些組分,和趨勢面分析的要求是重疊的或者是相容的。因此,在一定的條件下,它們可以起到趨勢面分析的作用。由于這些方法并非專用于分離趨勢和局部異常,故若作為趨勢面分析工具使用時,有的效果較好,如空間濾波,而多數(shù)的效果不如多項式趨勢面分析方法。

對趨勢面分析法,雖然人們都把它歸入統(tǒng)計學(xué)的范疇,但它在許多方面又不能嚴格地滿足統(tǒng)計上的條件,因此只能認為是一種簡單的斷面擬合。

趨勢面分析的結(jié)果表現(xiàn)為趨勢圖和局部異常,人們從中可以解讀出有意義的地理信息,而對趨勢面方程及其系數(shù),極少有人去探求其特定的含義,不同的函數(shù)可以產(chǎn)生幾乎相同的結(jié)果,也在一定程度上使得有關(guān)參數(shù)的物理意義難以明確。

7.7.2趨勢面模型

從理論上說,屬性數(shù)據(jù)的空間變化可以分解為三個部分;1)區(qū)域趨勢;2)局部異常;3)隨機干擾(即隨機噪聲)。

所謂區(qū)域趨勢是指遍及全區(qū)的、規(guī)模較大的地理過程的反映。局部異常是由規(guī)模比研究區(qū)小的地理過程所產(chǎn)生的,但其規(guī)模又至少大于兩個觀測點之間的距離。局部異常的規(guī)模和觀測點間距離的這種關(guān)系,一般在觀測點為規(guī)則網(wǎng)格時才是明確的。隨機干擾,一般認為是由抽樣誤差和觀測誤差組成,不包括系統(tǒng)誤差。隨機干擾的影響范圍很小,它僅限于單個觀測點的控制區(qū)內(nèi),或者說其規(guī)模小于相鄰兩觀測點之間的距離。

根據(jù)上述理論模型,有觀測面=區(qū)域趨勢+局部異常+隨機干擾每一具體的屬性值,都可以認為包含了上述三種成分。趨勢面分析的目的,是如何對這三種成分進行有效的分離。

隨機成分的分析要求有重復(fù)抽樣的觀測數(shù)據(jù),這在地理工作中往往難以滿足。因此在實際工作中,往往并不要求分離三種成分,而只要求分離其中的兩種成分。這樣,理論模型在實際應(yīng)用時就成為:觀測面=區(qū)域趨勢+局部異常

觀測面=區(qū)域趨勢+隨機干擾在上式中,局部異常成分必然包含隨機干擾成分,只不過異常成分處于主導(dǎo)地位,而隨機成分所占比重很小,以至于可以忽略不計。同理,隨機干擾仍可能包含有局部異常成分,只是它相對于隨機成分來說規(guī)模要小。由于隨機成分有可能包含有異常成分,因此它有時仍可以有一定的地理意義。在具體工作中,隨機成分里是否包含有局部異常成分,通過將分離開的各個成分分別作圖(一般只作等值線圖),進行對比,然后作地理解釋后才能確定。

趨勢面分析結(jié)果可以使用下式來說明擬合的程度:其中,n為樣點數(shù),z是屬性值,U是回歸平方和,S是離差平方和,c是擬合程度。

c值表明了趨勢面反映原始數(shù)據(jù)的程度。當(dāng)c=100%時,則趨勢值在所有的樣點上與原有值相等,但這種情況很少出現(xiàn),從趨勢面分析的角度看失去了分解的意義。c接近于0,說明擬合程度低。

如果設(shè)W為剩余平方和,即可以用F分布來檢驗結(jié)果的顯著性。F統(tǒng)計量為:其中m是趨勢面中多項式的項數(shù)(不包括常數(shù)項)。

在空間數(shù)據(jù)分析中,由于目的是分析趨勢和異常,所以,并不追求高的擬合程度。一般的,擬合程度達到60-80%,階數(shù)在1-4之間就可以滿足要求了。

7.7.3趨勢面分析實例

1.目的和地區(qū)概況

利用1:2.5萬地形圖對王家坡谷地形態(tài)進行分析,并與我國西部岡底斯山脈南坡的一條古冰川谷地進行形態(tài)對比,探討廬山谷地是否具有冰川谷的特征,進而推斷廬山是否曾發(fā)育過冰川。

王家坡谷地為地質(zhì)構(gòu)造上的向斜谷地。谷地兩側(cè)山脊線之間寬度平均為1300米,長約4000米,西南向東北傾斜,海拔高度由1200米降到200米。兩翼巖層傾角西北翼為30度左右,東南翼為35度左右。谷形成不對稱狀態(tài),谷底平緩。我們部分冰川學(xué)者認為,這是廬山最典型的古冰川谷地。

在1:2.5萬地形圖上,對王家坡谷地布置了341個規(guī)則網(wǎng)點,密度為8x8毫米。分別計算了1-3階的趨勢面(給出的是3階趨勢面的結(jié)果,圖7.11右),其中,3階趨勢面的模擬程度為98%。西藏東南部啊哪塘海洋冰川谷地3階趨勢面(左圖)的模擬程度為41%。兩條谷底的趨勢面圖的部分見圖7.5

2.趨勢面分析

圖7.5中左圖的等高距為50米,若插值為可與右圖相對比的25米等高距,則相鄰等高線之間距離變小,等高線密集,說明谷坡陡峭。同一高程的等高線在谷坡向谷底過渡中有明顯的轉(zhuǎn)折,說明坡麓清晰;過谷底的等高線較平直,說明谷底平緩;谷地兩側(cè)等高線大致都呈同一方向平直延伸(北-南);在東北部有一組等高線(4900米)向東彎曲,而4750米、4800米和4850米這組等高線在其下平直通過,谷地延伸與啊哪塘谷地近于直交,是一支冰川谷—懸谷。右圖的等高距為20米,谷坡則比左圖平緩。同一高程等高線從谷坡向谷底舒緩過渡,無明顯的轉(zhuǎn)折,說明谷坡谷底無明顯分界。過谷底的等高線都是圓弧狀,數(shù)條等高線排列整齊,形狀幾乎相同,說明坡面傾角與巖層傾角基本一致。兩個圖相比較無明顯相似處,表明王家坡谷地似未曾經(jīng)歷過冰川的強烈作用,谷地形態(tài)只是一個向斜谷地的典型地形特征。

圖7.5谷地趨勢面圖對比7.8方差云圖

在實際應(yīng)用中,人們更關(guān)心的對象的空間位置與其它屬性數(shù)據(jù)之間的關(guān)系。通過繪制實體屬性值的差異與其位置差異的圖件,可以得到這種關(guān)系的一般描述。所形成的圖件稱為方差云圖。

首先看一下圖7.6中的數(shù)據(jù),這是310x310米調(diào)查區(qū)的高程點,其中繪制等值線是為了顯示數(shù)據(jù)的總體空間變化特征。從北向南,總的趨勢是上坡。南坡地形似乎更為復(fù)雜一些。圖7.5高程點和等高線(注意等高線是人工勾繪的)對每個可能點對,我們按照點對高程差的平方根與點對的距離來繪圖,得到圖7.7。圖中點的分布比較雜亂,但從密集點的分布可以看出,高程點間距離越大,高程差異越大。

從圖7.6中可以看出,高度上的增加趨勢是由北向南。事實上,可以只繪制近南北方向分離的點對。如果將方向精確地限制在南北方向上,可能沒有繪圖的點對。所以實際上取的范圍是南北方向±50。類似地可繪制東西方向的點對。圖7.8給出了這些點對的分布,其中,南北方向的用空心圓表示,東西方向的用點表示。

在上圖中注意如下幾個方面:

1)繪圖的點數(shù)減少。這是因為南北和東西兩個方向上點的數(shù)目較少。實際上,我們可以推測每個方向上的點數(shù)大致是原來的10/180=1/18(假如數(shù)據(jù)點的分布是均勻的)。

2)可繪圖的距離范圍要小一些。因為研究區(qū)在兩個方向上是300米,300米就是最大的距離間隔。從空間分析來看,300米構(gòu)成了邊界效應(yīng)。

3)雖然有部分重疊,但南北方向上的差異要大于東西方向上的差異,反映了調(diào)查點的真實趨勢。

4)不同方向上顯示出的差異可以用各向異性(anisotropy)的概念來表示,即數(shù)據(jù)的空間變異與方向有關(guān)。相反,如果各個方向上沒有差異,則用概念各向同性來表示。

圖7.6高程點的方差云圖圖7.7南北方向(圓圈)和東西向(點)的方差云圖方差云圖是有用的探索工具,但因為點數(shù)多,所以有時候難以解釋。更簡要的概括是把距離軸改為不同的間隔(lag),然后對每個間隔內(nèi)的數(shù)據(jù)點進行概括。如

圖7.9所示,其中,有10個間隔,每個間隔是50米。在較大的距離間隔上,高程點的差異較大,這種趨勢很清楚。對應(yīng)于定義的研究區(qū),邊界效應(yīng)也很明顯,出現(xiàn)在間隔6和7中(對應(yīng)于300米)。間隔8,9,10包括了不同的差異,更多的反映了研究區(qū)四個角的空間特征。如果增大研究區(qū)的范圍,那么就不會出現(xiàn)這樣的效應(yīng)。圖7.8不同距離間隔的高程點盒子圖圖7.9表明,距離越遠,高程點之間的差異越大。這與我們熟知的地形變化是一致的。方差云圖有助于揭示數(shù)據(jù)中的自相關(guān)結(jié)構(gòu),但更重要的是,還可通過估計屬性的方差變異與間隔距離的函數(shù)關(guān)系,優(yōu)化插值的結(jié)果。

7.9區(qū)域變量和克里格插值

7.9.1區(qū)域化變量

一個變量的空間分布稱為該變量的區(qū)域化。如果變量以三個空間坐標(x,y,z)為自變量,那么該變量就是區(qū)域化變量。

區(qū)域化變量假定,在一定空間范圍內(nèi),屬性指標的變異可以用一個連續(xù)的、空間上相關(guān)的隨機域來模擬。任何變量的空間變異可以表示為三個主要組分之和:確定性成份、區(qū)域成分和隨機成分。

設(shè)x為樣點在1,2或3維空間的位置,x點的隨機變量Z值為:其中m(x)是描述Z結(jié)構(gòu)項的一個確定性數(shù),c’(x)是描述隨機區(qū)域變異但空間相關(guān)的殘余項,即區(qū)域變量,ξ"是殘余的空間不相關(guān)的高斯噪音項(服從標準正態(tài)分布,即平均值為0,方差為α2)。如果沒有趨勢,那么m(x)等于樣區(qū)數(shù)據(jù)的平均值,而且任何兩點x和x+h(h為間隔距離)之間的平均值或期望值的差為0。

使用Z(x),Z(x+h)表示隨機變量Z在位置x,x+h的觀測值,區(qū)域化變量理論假設(shè)任意兩點Z的差值的方差僅取決于位置間的距離h。

在有趨勢的情況下,假設(shè)數(shù)據(jù)是弱平穩(wěn)的,并假設(shè)對于所有的h,增量Z(x)-Z(x+h)的方差是有限的,而且只是相隔h的函數(shù)。在該假設(shè)成立的情況下,定義半方差為:其中,n是相隔距離為h的樣點對的個數(shù)。將r(h)和h作為縱、橫坐標作圖即可獲得實驗半方差函數(shù)圖(圖7.10)。實驗方差函數(shù)圖不受數(shù)據(jù)的非平穩(wěn)性影響,是空間變異性研究中的一個有力工具,也是區(qū)域變量定量描述的第一步。圖7.9實驗半方差變異函數(shù)圖在方差變異圖上,如果樣點具有空間關(guān)系,那么,空間上分布愈接近的點對(靠近x軸的左邊)應(yīng)該具有更相似的值(靠近y軸的下邊),而距離愈遠的點對(沿x軸方向向右移動),應(yīng)該具有更多的不相似性和更高的方差(沿y軸方向向上移動)。

7.9.2方差變異函數(shù)

7.9.2.1基本概念

圖7.11是一個典型的實驗方差函數(shù)和其理論方差函數(shù)曲線,它有下面幾個重要的特征。

1)隨間隔增大,方差增大,并在一定的間隔后達到一個基本穩(wěn)定的常數(shù)。這個方差常數(shù)稱為基臺(sill),在理論函數(shù)模型中用C+C0表示。平穩(wěn)數(shù)據(jù)的基臺值近似于采樣方差。

基臺值意味著在對應(yīng)(或大于)距離的樣點之間沒有空間相關(guān)性,因為方差不再隨距離變化。

2)曲線從較低的方差值升高,到一定的間隔值時到達基臺值,這一間隔稱為變程(range)。在理論函數(shù)模型中,變程用a表示。

變程是半方差函數(shù)中最重要的參數(shù),它描述了該間隔內(nèi)樣點的空間相關(guān)特征。在變程內(nèi),樣點越接近,兩點之間相似性、即空間上的相關(guān)性越強。很明顯,如果某點與已知點距離大于變程,那么該點數(shù)據(jù)不能用于數(shù)據(jù)內(nèi)插(或外推),因為空間上的自相關(guān)性不復(fù)存在。

變程的高低取決于觀測的尺度,說明了相互作用所影響的范圍。不同的屬性,其變程值可以變化很大。圖7.10典型試驗方差函數(shù)和擬合曲線3)理論方差函數(shù)曲線不穿過原點,而是存在一個最小的方差值。理論上講,當(dāng)間隔h=0時,估值的方差應(yīng)該為0,因為任何一點與自身之差的值為0。h趨近于0時,r(h)軸上的正截距是殘差的一個估計,該值稱為塊金(或基底,nugget)。在理論函數(shù)模型中,用C0表示。

塊金是在間隔距離小于采樣間距時的測量誤差或空間變異,或者是二者的和。測量誤差是由儀器的內(nèi)在誤差引起的,空間變異是自然現(xiàn)象在一定空間范圍內(nèi)的變化。小于采樣間距的微觀尺度上空間變異是塊金的一部分。

當(dāng)r(h)值在所有的h值上都等于基臺值時,實驗半方差函數(shù)就表現(xiàn)為純塊金效應(yīng),這通常由于短間距內(nèi)點與點的變異很大而引起,表明所使用的采樣間隔內(nèi)完全沒有空間相關(guān)性,此時,可以認為各個樣點是隨機的,區(qū)域平均值就是各點的最佳估計值。此時,只有增大采樣間隔才能揭示出空間相關(guān)性。

塊金與基臺的比值(C0/(C+C0),基底效應(yīng))可以用來說明空間的變異特征,該值越大,說明空間變異更多的是隨機成分引起的,否則,則是由特定的地理過程或多個過程綜合引起的。

空間相關(guān)性的強弱,可用C/(C+C0)表示,該值越高,表明空間相關(guān)性越強。

在實際的模型計算中,塊金與基臺兩個參數(shù)是可以調(diào)整的,其取值取決于整體的擬合效果。

7.9.2.2理論變異函數(shù)模型

理論變異函數(shù)模型用來擬合實驗半方差圖的離散點。常用的模型有如下幾種。

1.線性模型(Linearmodel_)其中,w是直線的斜率,此模型是最簡單模型,但在一定范圍內(nèi)也是適用的。在某些情況下,w可以為0,這時就是純塊金效應(yīng)模型。

2.球狀模型(Sphericalmodel)式中符號的意義與前面相同。球面模型最為常用,此外,由于球狀模型是根據(jù)三維空間的隨機移動平均過程推導(dǎo)獲得,因此特別適用于三維空間。

3.指數(shù)模型(Exponentialmodel)其中,d是控制方程空間范圍的距離參數(shù)。這里,僅在無窮遠處相關(guān)性完全消失。變程為3d。指數(shù)模型在統(tǒng)計理論中地位重要,它表示了空間隨機性的要素,是一階自回歸和馬爾可夫過程的半方差函數(shù)。作為自相關(guān)函數(shù),它們是采樣設(shè)計有效性的理論基礎(chǔ)。

4.高斯模型(Gaussianmodel)變程為。

圖7.11是球狀模型、指數(shù)模型和高斯模型的比較,可以看出,球狀模型的變程最小,指數(shù)的模型變程最大,高斯模型的變程介于二者之間。球狀模型和指數(shù)模型過原點存在切線,高斯模型則沒有。

圖7.11球狀模型、指數(shù)模型和高斯模型的比較5.雙曲線模型6.圓形模型在空間分析中,根據(jù)數(shù)據(jù)的空間自相關(guān)性和研究對象的先驗知識,選擇要使用的模型。選定了理論模型后,通常是用最小二乘法計算方程的各個參數(shù),并用最大似然法(ML)來選擇擬合效果最好的模型。

此外,在擬合中可以疊加使用上面的模型,模型的參數(shù)也可以進行調(diào)節(jié),以達到最大程度的擬合實驗數(shù)據(jù)。

7.9.2.3空間插值

計算理論方差函數(shù)是確定插值權(quán)重的基本過程,是預(yù)測未知位置屬性值的克里格方法(Kriging)的基礎(chǔ)。D.G.Krige是南非采礦工程學(xué)家,在1951年提出了礦產(chǎn)品位和儲量估值方法。法國地統(tǒng)計學(xué)家Matheron(1971)命名了這種方法,并在此基礎(chǔ)上提出了區(qū)域化變量理論,使傳統(tǒng)的地學(xué)方法與統(tǒng)計方法相結(jié)合,形成了完整的方法體系。

7.9.3克里格插值

克里格法是利用原始數(shù)據(jù)和半方差函數(shù)的結(jié)構(gòu)性,對未采樣點的區(qū)域化變量進行無偏最佳估計值的一種方法,這種方法的一個特點是能夠計算出每個估計值的誤差大小(估計值方差),從而能知道估計值的可靠性程度。克里格方法現(xiàn)已發(fā)展為多種類型,如簡單克里格(simpleKriging),普通克里格(ordinaryKriging),點克里格(pointKriging),塊段克里格(blockKriging),通用克里格(universalKriging),協(xié)同克里格(co-kriging),不連續(xù)克里格及指標克里格等。

如果變量滿足平穩(wěn)性假設(shè),可直接用點或塊段克里格方法,這兩種方法也稱普通克里格。如果是非平穩(wěn)的,需要采用泛克里格方法。如果分析多個變量的協(xié)同區(qū)域化問題,要采用協(xié)同克里格方法。其他的各種克里格方法也各有其應(yīng)用領(lǐng)域。

克里格插值與距離倒數(shù)加權(quán)插值的相似之處在于,二者都通過給已知樣本點賦權(quán)重來求其他點的預(yù)測值。兩種內(nèi)插方法的通用公式如下:其中,Z(si)是已測得的第i個位置的屬性值,wi是在第i個位置上測得值的權(quán)重,s0是待插值的位置,n是已知樣點的數(shù)目。

距離倒數(shù)加權(quán)插值中,權(quán)重wi僅取決于樣點到待插值點的距離。在克里格插值中,權(quán)重不僅考慮了已知點與插值點間的距離,而且考慮了己知點的位置和屬性值整體的空間分布和格局??死锔癫逯抵械臋?quán)重來自半方差函數(shù)模型(生成的表示地理現(xiàn)象連續(xù)表面的函數(shù)),在半方差函數(shù)模型和鄰近已知點的空間分布的基礎(chǔ)上,對研究區(qū)內(nèi)的各個位置進行預(yù)測,權(quán)重wi取決于已知點的擬合模型、到插值點的距離和插值點周圍的已知樣點的空間關(guān)系。

利用克里格方法進行預(yù)測,必須完成兩個任務(wù):(1)揭示空間相關(guān)規(guī)律;(2)進行預(yù)測。為此,克里格插值方法需要兩個步驟:(1)生成變異函數(shù)和協(xié)方差函數(shù),用于估算樣點值間的統(tǒng)計相關(guān)(空間自相關(guān))。變異函數(shù)和協(xié)方差函數(shù)取決于自相關(guān)模型(擬合模型)。(2)預(yù)測未知點的值。

7.9.3.1普通克里格方法

普通克里格是滿足假設(shè)的區(qū)域化變量的線性估計,它假設(shè)數(shù)據(jù)的變化呈正態(tài)分布,假設(shè)區(qū)域化變量Z的期望值是未知的(如果為已知的常數(shù),則為簡單克里格方法)。插值過程類似于加權(quán)滑動平均,只是權(quán)重值不是來自于確定性空間函數(shù),而是來自于空間數(shù)據(jù)分析。

1)點克里格

簡單的點估值是最常用的克里格法??死锔穹梢哉f是一種局部估值方法,每一估值都是由其鄰近觀測值加權(quán)平均計算而得的。有實驗表明,點克里格法比多項式和加權(quán)平均法的估值精度高。

由克里格法估值產(chǎn)生的方差圖,可以識別出需要進一步采樣的地區(qū)。

2)塊段克里格A

B

圖7.12半方差模型參數(shù)

A:各向同性

B:各向異性塊段克里格是對中心在x0的小區(qū)或塊段進行估值。任一塊段V中的屬性Z的克里格值,是其鄰近塊段觀測值xi的加權(quán)平均。

塊段克里格與點克里格法的區(qū)別僅在于權(quán)重系數(shù)的確定。當(dāng)塊段的大小等于原有平均點或樣點所覆蓋的范圍時,克里格就是精確內(nèi)插,因為內(nèi)插值與數(shù)據(jù)點值相等,點克里格就成為塊段克里格的特例。塊段克里格的估值方差總是小于點克里格法。

塊段克里格法的最普通用途是繪制等值線圖,而且圖中的等值線較平滑,對揭示區(qū)域內(nèi)的變化規(guī)律格局尤為有效。

普通克里格分析需要給出如下的結(jié)果:半方差圖(圖7.12),半方差模型參數(shù),克里格插值結(jié)果圖,插值結(jié)果的交叉檢驗(圖7.13-圖7.15)。下面給出的是對青海省青海湖西側(cè)鐵卜加樣區(qū)數(shù)據(jù)進行克里格分析得到的結(jié)果。數(shù)據(jù)樣本數(shù)為100,10x10等間隔30米采樣。指標為蟻蝗密度,單位是頭/平方米。AB

圖7.13克里格分析的半方差圖

A:各向同性

B:各向異性半方差模型中參數(shù)使用回歸方法估計(圖7.12)。對比確定系數(shù)r2和殘差的標準差RSS,選取指數(shù)模型為最佳半方差模型。這在各向同性和各向異性時均有較好的擬合效果。各向同性的模型獲得的變程為135.8m,各向異性模型獲得的變程為90-210米,依計算的方向不同有所差異。從擬合效果看(RSS最?。?,以90度方向的效果最好。

圖7.14是使用上述模型得到的插值結(jié)果,圖7.15是克里格插值的交叉檢驗圖。

圖7.15中,回歸系數(shù)表示回歸方程的擬合程度。最佳的回歸系數(shù)為1(圖中的實線部分,虛線是當(dāng)前的結(jié)果)。r2(圖中表示為r2)是確定系數(shù)。SE是標準差。當(dāng)我們認為蟻蝗密度的變化具有各向同性時,得到回歸系數(shù)高于各向異性,而且具有較低的預(yù)測標準誤差。所以,就研究地區(qū)而言,雖然種群密度在不同方向上是有變化的,但不是非常顯著。各向同性模型對于預(yù)測更為合適。

圖7.14各向同性的點克里格插值

圖7.15克里格插值的交叉檢驗

A:各向同性

B:各向異性7.9.3.2泛克里格方法

普通克里格方法要求數(shù)據(jù)是二階平穩(wěn)的或準平穩(wěn)的。如果數(shù)據(jù)在空間上存在明顯的趨勢,那么,普通克里格方法就不再適用。此時,應(yīng)該使用泛克里格方法進行分析。

泛克里格方法假設(shè)數(shù)據(jù)中有主導(dǎo)趨勢,而且該趨勢可以用一個確定性的函數(shù)或多項式來擬合。

進行泛克里格方法分析的步驟為:

1)趨勢分析

分析數(shù)據(jù)中存在的空間上的變化趨勢,獲得擬合模型。這部分內(nèi)容與前面的趨勢面分析相同。

2)殘差的克里格分析

這部分的分析方法與前面的普通克里格分析相同,不同的是,計算使用的數(shù)據(jù)是原始數(shù)據(jù)減去趨勢數(shù)據(jù),即殘差數(shù)據(jù)。

3)泛克里格插值

將趨勢面分析和殘差的克里格插值結(jié)果加和,即構(gòu)成了泛克里格方法分析的結(jié)果(圖7.16)。圖7.16泛克里格插值結(jié)果AIC準則可以用來對比模型的擬合程度,下面是三個模型的AIC值:

趨勢面分析

500.08

普通克里格方法

490.21

泛克里格方法

470.31

克里格方法明顯的優(yōu)于趨勢面分析,泛克里格插值結(jié)果比普通克里格方法要更好一些。

7.9.3.3協(xié)同克里格方法

通常同一個樣點有多個屬性值,某一屬性的空間分布經(jīng)常與其它屬性密切相關(guān),因為它們受同樣的區(qū)域化現(xiàn)象或空間過程的影響,這些屬性就稱為協(xié)同區(qū)域化屬性。某些屬性Z2測定可能比較昂貴,所以數(shù)據(jù)點較稀,而另一些Z1則易于獲得因而觀測值較多。如果Z1和Z2空間相關(guān),那么就可以利用Z1的空間變異信息獲取Z2的分布狀況。除了描述各自非結(jié)構(gòu)性變異之外,協(xié)同克里格還需要分析兩個變量的聯(lián)合交叉變異。兩個變量Z1,Z2的協(xié)同區(qū)域化可以用它們的交叉半方差函數(shù)(cross-semivariogram)來表示:其中,n(h)是以距離間隔h內(nèi)的樣本數(shù)目。協(xié)同區(qū)域化屬性的空間相關(guān)性也可以用交叉相關(guān)函數(shù)來確定。交叉方差可以是正值,也可以是負值,依Z1和Z2的相關(guān)關(guān)系而定。

協(xié)同克里格法把區(qū)域化變量理論的最佳估值方法從單一屬性發(fā)展到二個以上的協(xié)同區(qū)域化屬性。當(dāng)某一屬性由于各種原因無法充分采樣時,協(xié)同克里格法可以利用它與另一個采樣多的變量之間的空間相關(guān)性,有效地提供具有一定精度的估值。協(xié)同克里格在計算中要用到Z1,Z2各自的半方差函數(shù)和交叉半方差函數(shù),計算比較復(fù)雜。

協(xié)同克里格既可用于點估值,也可用于塊段估值。如果變量的空間模式與常見的物理過程相聯(lián)系,協(xié)同克里格法最為成功。例如,Leenaersetal(1989)在荷蘭南北Geul河沖積平原表土重金屬(Cd,Pb和Zn)含量分布的制圖中,使用了協(xié)同克里格方法。因為污染物總是吸附于緩慢沉降的細顆粒,重金屬污染會在長期停留的地方富集。結(jié)果發(fā)現(xiàn),沖積平原中泛濫河水停留時間最長的地方重金屬含量最高,表明該區(qū)域相對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論