版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第5講空間統(tǒng)計(jì)分析授課人:王杰Email:wangjie09@安徽大學(xué)資源與環(huán)境工程學(xué)院《地理信息系統(tǒng)科研方法》課程第5講空間統(tǒng)計(jì)分析授課人:王杰安徽大學(xué)資源與環(huán)境工程本講內(nèi)容探索性空間統(tǒng)計(jì)分析地統(tǒng)計(jì)分析方法本講內(nèi)容探索性空間統(tǒng)計(jì)分析2空間統(tǒng)計(jì)分析,即空間數(shù)據(jù)(spatialdata)的統(tǒng)計(jì)分析,是現(xiàn)代計(jì)量地理學(xué)中一個(gè)快速發(fā)展的方向和領(lǐng)域??臻g統(tǒng)計(jì)分析,其核心就是認(rèn)識與地理位置相關(guān)的數(shù)據(jù)間的空間依賴、空間關(guān)聯(lián)或空間自相關(guān),通過空間位置建立數(shù)據(jù)間的統(tǒng)計(jì)關(guān)系。空間統(tǒng)計(jì)分析的任務(wù),就是運(yùn)用有關(guān)統(tǒng)計(jì)方法,建立空間統(tǒng)計(jì)模型,從凌亂的數(shù)據(jù)中挖掘空間自相關(guān)與空間變異規(guī)律。
空間統(tǒng)計(jì)分析空間統(tǒng)計(jì)分析,即空間數(shù)據(jù)(spatialdata)的統(tǒng)計(jì)分3空間數(shù)據(jù)分析與傳統(tǒng)統(tǒng)計(jì)分析主要有兩大差異:(1)空間數(shù)據(jù)間并非獨(dú)立,而是在維空間中具有某種空間相關(guān)性,且在不同的空間分辨率下呈現(xiàn)不同之相關(guān)程度;(2)地球只有一個(gè),大多數(shù)空間問題僅有一組(空間分布不規(guī)則的)觀測值,而無重復(fù)觀測數(shù)據(jù)。因此,空間現(xiàn)象的了解與描述是極為復(fù)雜的,而傳統(tǒng)方法,尤其是建立在獨(dú)立樣本上的統(tǒng)計(jì)方法,不適合分析空間數(shù)據(jù)??臻g統(tǒng)計(jì)VS.經(jīng)典統(tǒng)計(jì)經(jīng)典統(tǒng)計(jì):獨(dú)立性、隨機(jī)性假設(shè)空間統(tǒng)計(jì):自相關(guān)、依賴性、異質(zhì)性空間數(shù)據(jù)分析與傳統(tǒng)統(tǒng)計(jì)分析主要有兩大差異:空間統(tǒng)計(jì)VS.4地理學(xué)第一定律(FLG):everythingisrelatedtoeverythingelse,butnearthingsaremorerelatedthandistantthings(Tobler,1970).空間統(tǒng)計(jì)的基本思想:WaldoTobler(bornin1930)receivingaplaqueforhiscontributionstogeography.OntheeventofhisNovember2000birthday./wiki/Waldo_R._Tobler
Tobler,W.R.(1970)."AcomputermoviesimulatingurbangrowthintheDetroitregion".EconomicGeography,46(2):234-240.FLG的一般性:自然地理、人文地理、社會(huì)經(jīng)濟(jì)地理學(xué)第一定律(FLG):everythingisre5空間自相關(guān)是普遍存在的,否則地理分析便沒有多大意義。
經(jīng)典統(tǒng)計(jì):獨(dú)立
空間自相關(guān)的存在,使得經(jīng)典統(tǒng)計(jì)學(xué)所要求的樣本獨(dú)立性假設(shè)不滿足。如果地理學(xué)從根本上值得研究,必然是因?yàn)榈乩憩F(xiàn)象在空間上的變化不是隨機(jī)的。
經(jīng)典統(tǒng)計(jì):隨機(jī)空間自相關(guān)是普遍存在的,否則地理分析便沒有多大意義。6可以借助空間統(tǒng)計(jì)更好地理解地理現(xiàn)象。
或許學(xué)習(xí)空間統(tǒng)計(jì)最重要的原因是我們不僅僅想知道問題“怎么樣”,更想知道“哪里怎么樣”
空間統(tǒng)計(jì)學(xué)可以幫助我們準(zhǔn)確地判斷具體地理模式的原因。
JohnSnow的霍亂地圖
當(dāng)發(fā)現(xiàn)某種病僅僅發(fā)生在靠近河流的村莊時(shí),河流中的寄生物可能是病源??臻g統(tǒng)計(jì)學(xué)可以幫助我們處理大的復(fù)雜數(shù)據(jù)集,這是GIS經(jīng)常面對的事情。為什么要用空間統(tǒng)計(jì)可以借助空間統(tǒng)計(jì)更好地理解地理現(xiàn)象。為什么要用空間統(tǒng)計(jì)7霍亂病死者居住分布圖(JohnSnow,1854)1854年8月到9月英國倫敦霍亂流行時(shí),當(dāng)局始終找不到發(fā)病的原因,后來醫(yī)生約翰·斯諾(JohnSnow)參與調(diào)查。他在繪有霍亂流行地區(qū)所有道路、房屋、飲用水機(jī)井等內(nèi)容的1:6500比例尺地圖上,標(biāo)出了每個(gè)霍亂病死者的居住位置,得到了霍亂病死者居住分布圖?;魜y病死者居住分布圖(JohnSnow,1854)1858一.探索性空間統(tǒng)計(jì)分析
基本原理與方法
應(yīng)用實(shí)例
一.探索性空間統(tǒng)計(jì)分析基本原理與方法9探索性空間數(shù)據(jù)分析(ESDA)ESDA是指利用統(tǒng)計(jì)學(xué)原理和圖形圖表相結(jié)合對空間信息的性質(zhì)進(jìn)行分析、鑒別,用以引導(dǎo)確定性模型的結(jié)構(gòu)和解法。ESDA與EDA區(qū)別在于它考慮了數(shù)據(jù)的空間特性,在方法上它將數(shù)據(jù)分解為一般趨勢和疊加于其上的局部變化兩部分。然后用一定的數(shù)學(xué)函數(shù)去擬合由樣本點(diǎn)產(chǎn)生的經(jīng)驗(yàn)變率函數(shù),進(jìn)行諸如克立格內(nèi)插等空間操作。探索性空間數(shù)據(jù)分析(ESDA)ESDA是指利用統(tǒng)計(jì)學(xué)原理和圖10
通常定義一個(gè)二元對稱空間權(quán)重矩陣W,來表達(dá)n個(gè)位置的空間區(qū)域的鄰近關(guān)系,其形式如下式中:Wij表示區(qū)域i與j的臨近關(guān)系,它可以根據(jù)鄰接標(biāo)準(zhǔn)或距離標(biāo)準(zhǔn)來度量。
1.基本原理與方法
(一)空間權(quán)重矩陣
通常定義一個(gè)二元對稱空間權(quán)重矩陣W,來表達(dá)n個(gè)位置的11①簡單的二進(jìn)制鄰接矩陣②基于距離的二進(jìn)制空間權(quán)重矩陣兩種最常用的確定空間權(quán)重矩陣的規(guī)則
①簡單的二進(jìn)制鄰接矩陣兩種最常用的確定空間權(quán)重矩陣12(二)全局空間自相關(guān)
Moran指數(shù)反映的是空間鄰接或空間鄰近的區(qū)域單元屬性值的相似程度。
Geary系數(shù)與Moran指數(shù)存在負(fù)相關(guān)關(guān)系。
PatrickA.P.Moran(1917-1988)
Moran指數(shù)和Geary系數(shù)是兩個(gè)用來度量空間自相關(guān)的全局指標(biāo)。全局空間自相關(guān)概括了在一個(gè)總的空間范圍內(nèi)空間依賴的程度。(二)全局空間自相關(guān)Moran指數(shù)反映的是空間鄰接或空13
如果是位置(區(qū)域)的觀測值,則該變量的全局Moran指數(shù)I,用如下公式計(jì)算式中:I為Moran指數(shù);
;。如果是位置(區(qū)域)的觀測值,則該變量的全局Moran指14Geary系數(shù)C計(jì)算公式如下
式中:C為Geary系數(shù);其他變量同上式。如果引入記號Geary系數(shù)C計(jì)算公式如下15
則全局Moran指數(shù)I的計(jì)算公式也可以進(jìn)一步寫成
Moran指數(shù)I的取值一般在[-1,1]之間,小于0表示負(fù)相關(guān),等于0表示不相關(guān),大于0表示正相關(guān);
Geary系數(shù)C的取值一般在[0,2]之間,大于1表示負(fù)相關(guān),等于1表示不相關(guān),而小于1表示正相關(guān)。
則全局Moran指數(shù)I的計(jì)算公16
(三)局部空間自相關(guān)描述一個(gè)空間單元與其領(lǐng)域的相似程度,能夠表示每個(gè)局部單元服從全局總趨勢的程度(包括方向和量級),反映了空間異質(zhì)性,說明空間依賴是如何隨位置變化的。局部空間自相關(guān)分析方法包括3種:
空間聯(lián)系的局部指標(biāo)(LISA);
G統(tǒng)計(jì)量;
Moran散點(diǎn)圖(三)局部空間自相關(guān)描述一個(gè)空間單元與其17空間聯(lián)系的局部指標(biāo)(LISA)
空間聯(lián)系的局部指標(biāo)(localindicatorsofspatialassociation,縮寫為LISA)滿足下列兩個(gè)條件:(1)每個(gè)區(qū)域單元的LISA,是描述該區(qū)域單元周圍顯著的相似值區(qū)域單元之間空間集聚程度的指標(biāo);(2)所有區(qū)域單元LISA的總和與全局的空間聯(lián)系指標(biāo)成比例??臻g聯(lián)系的局部指標(biāo)(LISA)空間聯(lián)系的18LISA包括局部Moran指數(shù)(localMoranindex)和局部Geary指數(shù)(localGearyindex),下面重點(diǎn)介紹和討論局部Moran指數(shù)。LISA包括局部Moran指數(shù)(localMora19局部Moran指數(shù)被定義為可進(jìn)一步寫成
式中:和是經(jīng)過標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化的觀測值。局部Moran指數(shù)檢驗(yàn)的標(biāo)準(zhǔn)化統(tǒng)計(jì)量為
局部Moran指數(shù)被定義為20G統(tǒng)計(jì)量全局G統(tǒng)計(jì)量的計(jì)算公式為對每一個(gè)區(qū)域單元的統(tǒng)計(jì)量為
探測區(qū)域單元是屬于高值集聚還是低值集聚的空間分布模式.G統(tǒng)計(jì)量全局G統(tǒng)計(jì)量的計(jì)算公式為探測區(qū)域單元是屬于21
對統(tǒng)計(jì)量的檢驗(yàn)與局部Moran指數(shù)相似,其檢驗(yàn)值為
顯著的正值表示在該區(qū)域單元周圍,高觀測值的區(qū)域單元趨于空間集聚,而顯著的負(fù)值表示低觀測值的區(qū)域單元趨于空間集聚,與Moran指數(shù)只能發(fā)現(xiàn)相似值(正關(guān)聯(lián))或非相似性觀測值(負(fù)關(guān)聯(lián))的空間集聚模式相比,具有能夠探測出區(qū)域單元屬于高值集聚還是低值集聚的空間分布模式。對統(tǒng)計(jì)量的檢驗(yàn)與局部Moran指數(shù)相似,其檢驗(yàn)值為22Moran散點(diǎn)圖
以(Wz,z)為坐標(biāo)點(diǎn)的Moran散點(diǎn)圖,常來研究局部的空間不穩(wěn)定性,它對空間滯后因子Wz和z數(shù)據(jù)對進(jìn)行了可視化的二維圖示。全局Moran指數(shù),可以看作是Wz對于z的線性回歸系數(shù),對界外值以及對Moran指數(shù)具有強(qiáng)烈影響的區(qū)域單元,可通過標(biāo)準(zhǔn)回歸來診斷出。由于數(shù)據(jù)對(Wz,z)經(jīng)過了標(biāo)準(zhǔn)化,因此界外值可易由2-sigma規(guī)則可視化地識別出來。Moran散點(diǎn)圖以(Wz,z)為坐標(biāo)點(diǎn)23Moran散點(diǎn)圖的4個(gè)象限,分別對應(yīng)于區(qū)域單元與其鄰居之間4種類型的局部空間聯(lián)系形式:第1象限代表了高觀測值的區(qū)域單元被高值的區(qū)域所包圍的空間聯(lián)系形式;第2象限代表了低觀測值的區(qū)域單元被高值的區(qū)域所包圍的空間聯(lián)系形式;Moran散點(diǎn)圖的4個(gè)象限,分別對應(yīng)于區(qū)域單元24
第3象限代表了低觀測值的區(qū)域單元被低值的區(qū)域所包圍的空間聯(lián)系形式;第4象限代表了高觀測值的區(qū)域單元被低值的區(qū)域所包圍的空間聯(lián)系形式。
252.應(yīng)用實(shí)例
中國大陸30個(gè)省級行政區(qū)人均GDP的空間關(guān)聯(lián)分析。根據(jù)各?。ㄖ陛犑小⒆灾螀^(qū))之間的鄰接關(guān)系,采用二進(jìn)制鄰接權(quán)重矩陣,選取各?。ㄖ陛犑?、自治區(qū))1998—2002年人均GDP的自然對數(shù),依照公式計(jì)算全局Moran指數(shù)I,計(jì)算其檢驗(yàn)的標(biāo)準(zhǔn)化統(tǒng)計(jì)量Z(I),結(jié)果如下表所示。年份IZP19980.50014.50350.000019990.50694.55510.000020000.51124.59780.000020010.50594.55320.000020020.50134.53260.00002.應(yīng)用實(shí)例中國大陸30個(gè)省級行政區(qū)人均GDP26
從表中可以看出,在1998—2002年期間,中國大陸30個(gè)省級行政區(qū)人均GDP的全局Moran指數(shù)均為正值;在正態(tài)分布假設(shè)之上,對Moran指數(shù)檢驗(yàn)的結(jié)果也高度顯著。這就是說,在1998—2002年期間,中國大陸30個(gè)省級行政區(qū)人均GDP存在著顯著的、正的空間自相關(guān),也就是說各省級行政區(qū)人均GDP水平的空間分布表現(xiàn)出相似值之間的空間集聚,其空間聯(lián)系的特征是:較高人均GDP水平的省級行政區(qū)相對地趨于和較高人均GDP水平的省級行政區(qū)相鄰,或者較低人均GDP水平的省級行政區(qū)相對地趨于和較低人均GDP水平的省級行政區(qū)相鄰。從表中可以看出,在1998—2002年期間,中國大陸27
選取2001年我國30個(gè)省級行政區(qū)人均GDP數(shù)據(jù),計(jì)算局部Gi統(tǒng)計(jì)量和局部Gi統(tǒng)計(jì)量的檢驗(yàn)值Z(Gi),并繪制統(tǒng)計(jì)地圖如下。選取2001年我國30個(gè)省級行政區(qū)人均GDP數(shù)據(jù)28
檢驗(yàn)結(jié)果表明,貴州、四川、云南西部3省的Z值在0.05的顯著性水平下顯著,重慶的Z值在0.1的顯著性水平下顯著,該4省市在空間上相連成片分布,而且從統(tǒng)計(jì)學(xué)意義上來說,與該區(qū)域相鄰的省區(qū),其人均GDP趨于為同樣是人均GDP低值的省區(qū)所包圍。由此形成人均GDP低值與低值的空間集聚,據(jù)此可認(rèn)識到西部落后省區(qū)趨于空間集聚的分布特征。
檢驗(yàn)結(jié)果表明,貴州、四川、云南西部3省的Z29
東部的江蘇、上海、浙江三省市的Z值在0.05的顯著性水平下顯著,天津的Z值在0.1的顯著性水平下顯著。而東部上海、江浙等發(fā)達(dá)省市趨于為一些相鄰經(jīng)濟(jì)發(fā)展水平相對較高的省份所包圍,東部發(fā)達(dá)地區(qū)的空間集聚分布特征也顯現(xiàn)出來。東部的江蘇、上海、浙江三省市的Z值在0.030
以(Wz,z)為坐標(biāo),進(jìn)一步繪制Moran散點(diǎn)圖可以發(fā)現(xiàn),多數(shù)?。ㄖ陛犑?、自治區(qū))位于第1和第3象限內(nèi),為正的空間聯(lián)系,屬于低低集聚和高高集聚類型,而且位于第3象限內(nèi)的低低集聚類型的?。ㄖ陛犑小⒆灾螀^(qū))比位于第1象限內(nèi)的高高集聚類型的?。ㄖ陛犑小⒆灾螀^(qū))更多一些。以(Wz,z)為坐標(biāo),進(jìn)一步繪制Moran散點(diǎn)圖31空間統(tǒng)計(jì)分析方法ppt課件32
上圖進(jìn)一步顯示了30個(gè)省級行政區(qū)人均GDP局部集聚的空間結(jié)構(gòu)。可以看出,從人均GDP水平相對地來看:高值被高值包圍的高高集聚?。ㄖ陛犑校┯校罕本?、天津、河南、安徽、湖北、江西、海南、廣東、福建、浙江、山東、上海、江蘇;低值被低值包圍的低低集聚?。ㄗ灾螀^(qū))有:黑龍江、內(nèi)蒙古、新疆、吉林、甘肅、山西、陜西、青海、西藏、四川、云南、遼寧、貴州;被低值包圍的高值?。ㄖ陛犑校┯校褐貞c、廣西、河北;被高值包圍的低值省份只有湖南。上圖進(jìn)一步顯示了30個(gè)省級行政區(qū)人均GDP局部集聚的空331978、1990、2001、2007年全國各省市人均GDP的LISA顯著水平圖1978、1990、2001、2007年全國各省市人均GDP34二、地統(tǒng)計(jì)分析方法地統(tǒng)計(jì)方法的基本原理
應(yīng)用實(shí)例
二、地統(tǒng)計(jì)分析方法地統(tǒng)計(jì)方法的基本原理35地統(tǒng)計(jì)學(xué)(Geostatistics),又稱地質(zhì)統(tǒng)計(jì)學(xué),是法國著名統(tǒng)計(jì)學(xué)家G.Matheron在大量理論研究基礎(chǔ)上提出的。地統(tǒng)計(jì)學(xué)是以區(qū)域化變量理論為基礎(chǔ),以變異函數(shù)為主要工具,研究那些在空間分布上既有隨機(jī)性又有結(jié)構(gòu)性,或空間相關(guān)和依賴性,或空間格局與變異,并對這些數(shù)據(jù)進(jìn)行最優(yōu)無偏內(nèi)插估計(jì),或模擬這些數(shù)據(jù)的離散性、波動(dòng)性。協(xié)方差函數(shù)和變異函數(shù)是以區(qū)域化變量理論為基礎(chǔ)建立起來的地統(tǒng)計(jì)學(xué)的兩個(gè)最基本的函數(shù)。地統(tǒng)計(jì)學(xué)的主要方法之一,克立格法就是建立在變異函數(shù)理論和結(jié)構(gòu)分析基礎(chǔ)之上的。
地統(tǒng)計(jì)學(xué)(Geostatistics),又稱地質(zhì)統(tǒng)計(jì)學(xué),是36
當(dāng)一個(gè)變量呈現(xiàn)為空間分布時(shí),就稱之為區(qū)域化變量。這種變量常常反映某種空間現(xiàn)象的特征,用區(qū)域化變量來描述的現(xiàn)象稱之為區(qū)域化現(xiàn)象。
區(qū)域化變量,亦稱區(qū)域化隨機(jī)變量,G.Matheron(1963)將它定義為以空間點(diǎn)x的三個(gè)直角坐標(biāo)為自變量的隨機(jī)場區(qū)域化變量具有兩個(gè)最顯著,而且也是最重要的特征,即隨機(jī)性和結(jié)構(gòu)性。1.地統(tǒng)計(jì)方法的基本原理(一)區(qū)域化變量
當(dāng)一個(gè)變量呈現(xiàn)為空間分布時(shí),就稱之為區(qū)域化變量。這種變量37區(qū)域化變量的功能:
由于區(qū)域化變量是一種隨機(jī)函數(shù),因而能同時(shí)反映空間變量的結(jié)構(gòu)性和隨機(jī)性。一方面,當(dāng)空間點(diǎn)x固定后,Z(x)就是一個(gè)隨機(jī)變量,這體現(xiàn)了其隨機(jī)性。另一方面,在空間兩個(gè)不同點(diǎn)x與x+h處的區(qū)域化變量值具有某種程度的相關(guān)性,這體現(xiàn)了其結(jié)構(gòu)性。區(qū)域化變量的功能: 由于區(qū)域化變量是一種隨機(jī)函數(shù),因而能同時(shí)38區(qū)域化變量的組成部分
數(shù)據(jù)點(diǎn)結(jié)構(gòu)性可以用均值和常數(shù)趨勢表示空間相關(guān)數(shù)據(jù)通常呈現(xiàn)正空間相關(guān)性
隨機(jī)性測量誤差,其他誤差
區(qū)域化變量的組成部分?jǐn)?shù)據(jù)點(diǎn)結(jié)構(gòu)性39distance
elevation
結(jié)構(gòu)性隨機(jī)性實(shí)際值distanceelevation結(jié)構(gòu)性隨機(jī)性實(shí)際值40(二)協(xié)方差函數(shù)
協(xié)方差函數(shù)的概念
區(qū)域化隨機(jī)變量之間的差異,可以用空間協(xié)方差來表示。在概率論中,隨機(jī)向量X與Y的協(xié)方差被定義為
區(qū)域化變量在空間點(diǎn)x和x+h處的兩個(gè)隨機(jī)變量和的二階混合中心矩定義為Z(x)的自協(xié)方差函數(shù),即(4.2.2)(4.2.1)(二)協(xié)方差函數(shù)協(xié)方差函數(shù)的概念(4.2.2)(41協(xié)方差函數(shù)的計(jì)算公式
式中:h為兩樣本點(diǎn)空間分隔距離或距離滯后;為在空間位置處的實(shí)測值;是在處距離偏離h的實(shí)測值[i=1,2,…,],是分隔距離為h時(shí)的樣本點(diǎn)對(paris)總數(shù),和分別為和的樣本平均數(shù),即(4.2.3)(4.2.4)(4.2.5)協(xié)方差函數(shù)的計(jì)算公式(4.2.3)(4.2.4)(4.2.
若==m(常數(shù)),則上式可以改寫為
式中:m為樣本平均數(shù),可由一般算術(shù)平均數(shù)公式求得,即
(4.2.6)若=43(三)變異函數(shù)
變異函數(shù)的概念
變異函數(shù)(variograms),又稱變差函數(shù)、變異矩,是地統(tǒng)計(jì)分析所特有的基本工具。在一維條件下變異函數(shù)定義為,當(dāng)空間點(diǎn)x在一維x軸上變化時(shí),區(qū)域化變量Z(x)在點(diǎn)x和x+h處的值Z(x)與Z(x+h)差的方差的一半為區(qū)域化變量Z(x)在x軸方向上的變異函數(shù),記為γ(h),即
(4.2.7)(三)變異函數(shù)變異函數(shù)的概念(4.2.7)44
在二階平穩(wěn)假設(shè)條件下,對任意的h有因此,公式可以改寫為
從上式可知,變異函數(shù)依賴于兩個(gè)自變量x和h,當(dāng)變異函數(shù)僅僅依賴于距離h而與位置x無關(guān)時(shí),可改寫成,即
(4.2.9)(4.2.8)在二階平穩(wěn)假設(shè)條件下,對任意的h有(4.2.9)(445變異函數(shù)的性質(zhì)
設(shè)Z(x)是區(qū)域化變量,在滿足二階平穩(wěn)假設(shè)條件下,變異函數(shù)式具有如下性質(zhì):
(1)=0,即在h=0處,變異函數(shù)為0;
(2)=,即關(guān)于直線h=0是對稱的,它是一個(gè)偶函數(shù);
(3)≥0,即只能大于或等于0;變異函數(shù)的性質(zhì)46變異函數(shù)的計(jì)算公式
設(shè)是系統(tǒng)某屬性Z在空間位置x處的值,為一區(qū)域化隨機(jī)變量,并滿足二階平穩(wěn)假設(shè),h為兩樣本點(diǎn)空間分隔距離,和分別是區(qū)域化變量在空間位置和處的實(shí)測值[i=1,2,…,N(h)],那么,變異函數(shù)的離散計(jì)算公式為(4.2.10)變異函數(shù)的計(jì)算公式設(shè)是系統(tǒng)某屬性Z在空間位置47
這樣對不同的空間分隔距離h,計(jì)算出相應(yīng)的和值。如果分別以h為橫坐標(biāo),或?yàn)榭v坐標(biāo),畫出協(xié)方差函數(shù)和變異函數(shù)曲線圖,就可以直接展示區(qū)域化變量Z(x)的空間變異特點(diǎn)??梢?,變異函數(shù)能同時(shí)描述區(qū)域化變量的隨機(jī)性和結(jié)構(gòu)性,從而在數(shù)學(xué)上對區(qū)域化變量進(jìn)行嚴(yán)格分析,是空間變異規(guī)律分析和空間結(jié)構(gòu)分析的有效工具。這樣對不同的空間分隔距離h,計(jì)算出相應(yīng)的48空間統(tǒng)計(jì)分析方法ppt課件49例如:假設(shè)某地區(qū)降水量Z(x)(單位:mm)是二維區(qū)域化隨機(jī)變量,滿足二階平穩(wěn)假設(shè),其觀測值的空間正方形網(wǎng)格數(shù)據(jù)如圖4.2.1所示(點(diǎn)與點(diǎn)之間的距離為h=1km)。試計(jì)算其南北方向及西北和東南方向的變異函數(shù)。例如:假設(shè)某地區(qū)降水量Z(x)(單位:mm)是二維區(qū)域化隨機(jī)50圖4.2.1空間正方形網(wǎng)格數(shù)據(jù)(點(diǎn)間距h=1km)
從圖4.2.1可以看出,空間上有些點(diǎn),由于某種原因沒有采集到。如果沒有缺失值,可直接對正方形網(wǎng)格數(shù)據(jù)結(jié)構(gòu)計(jì)算變異函數(shù);在有缺失值的情況下,也可以計(jì)算變異函數(shù)。只要“跳過”缺失點(diǎn)位置即可(圖4.2.2)。圖4.2.1空間正方形網(wǎng)格數(shù)據(jù)(點(diǎn)間距h=1km)51圖4.2.2缺失值情況下樣本數(shù)對的組成和計(jì)算過程
☉為缺失值
圖4.2.2缺失值情況下樣本數(shù)對的組成和計(jì)算過程
☉為缺52圖1空間正方形網(wǎng)格數(shù)據(jù)(點(diǎn)間距h=1km)
圖1空間正方形網(wǎng)格數(shù)據(jù)(點(diǎn)間距h=1km)53圖2空間正方形網(wǎng)格數(shù)據(jù)(點(diǎn)間距h=2km)
圖2空間正方形網(wǎng)格數(shù)據(jù)(點(diǎn)間距h=2km)54
首先計(jì)算南北方向上的變異函數(shù)值,由變異函數(shù)的計(jì)算公式可得
=385/72=5.35圖4.2.2缺失值情況下樣本數(shù)對的組成和計(jì)算過程
☉為缺失值
首先計(jì)算南北方向上的變異函數(shù)值,由變異函數(shù)的計(jì)算公式55
同樣計(jì)算出最后,得到南北方向和西北—東南方向上的變異函數(shù)計(jì)算結(jié)果見下表。同樣可以計(jì)算東西方向上的變異函數(shù)。
方向
南北
方向
西北—東南
h12345h1.412.824.245.657.07N(h)
362721135N(h)
322113825.359.2617.5525.6922.907.0612.9530.8558.1350.00同樣計(jì)算出方向變異函數(shù)的參數(shù)
變異函數(shù)有4個(gè)非常重要的參數(shù),即基臺值(sill)、變程(range)或稱空間依賴范圍(rangeofspatialdependence)、塊金值(nugget)或稱區(qū)域不連續(xù)性值(localizeddiscontinuity)和分維數(shù)(fractaldimension)。前3個(gè)參數(shù)可以直接從變異函數(shù)圖中得到。它們決定變異函數(shù)的形狀與結(jié)構(gòu)。變異函數(shù)的形狀反映自然現(xiàn)象空間分布結(jié)構(gòu)或空間相關(guān)的類型,同時(shí)還能給出這種空間相關(guān)的范圍。變異函數(shù)的參數(shù)變異函數(shù)有4個(gè)非常重要的參數(shù),即基57
當(dāng)變異函數(shù)隨著間隔距離h的增大,從非零值達(dá)到一個(gè)相對穩(wěn)定的常數(shù)時(shí),該常數(shù)稱為基臺值C0+C。當(dāng)間隔距離h=0時(shí),γ(0)=C0,該值稱為塊金值或塊金方差(nuggetvariance)?;_值是系統(tǒng)或系統(tǒng)屬性中最大的變異,變異函數(shù)達(dá)到基臺值時(shí)的間隔距離a稱為變程。變程表示在h≥a以后,區(qū)域化變量Z(x)空間相關(guān)性消失。當(dāng)變異函數(shù)隨著間隔距離h的增大,從非零值達(dá)到一個(gè)相對穩(wěn)定的58第4個(gè)參數(shù),即分維數(shù)用于表示變異函數(shù)的特性,由變異函數(shù)和間隔距離h之間的關(guān)系確定
其中,分維數(shù)D為雙對數(shù)直線回歸方程中的斜率,它是一個(gè)無量綱數(shù)。分維數(shù)D的大小,表示變異函數(shù)曲線的曲率,可以作為隨機(jī)變異的量度。第4個(gè)參數(shù),即分維數(shù)用于表示變異函數(shù)的特性,由變異函數(shù)59理論變異函數(shù)模型實(shí)踐中,常用的是變異函數(shù)圖:偏基臺值:C(partialsill)塊金值:C0(nugget)變程:a(range)h基臺值(sill)notrelatedanymore變程范圍內(nèi)才有結(jié)構(gòu)性變化(有規(guī)律的變化)反映隨機(jī)性大小:主要來源于區(qū)域化變量Z(x)在小于抽樣尺度h時(shí)所具有的內(nèi)部變異;另外還有抽樣分析誤差。變異函數(shù)是一個(gè)單調(diào)不減函數(shù)。當(dāng)h超過某一個(gè)范圍,例如變程,變異函數(shù)不再增大,而是趨于一個(gè)極限值,即為基臺值。實(shí)際上等于區(qū)域化變量的先驗(yàn)方差。即,即基臺值與塊金值之差,表示數(shù)據(jù)中存在空間相關(guān)性引起的方差變化范圍。理論變異函數(shù)模型實(shí)踐中,常用的是變異函數(shù)圖:偏基臺值:C塊金60變異函數(shù)的理論模型
地統(tǒng)計(jì)學(xué)將變異函數(shù)理論模型分為3大類:第1類是有基臺值模型,包括球狀模型、指數(shù)模型、高斯模型、線性有基臺值模型和純塊金效應(yīng)模型;第2類是無基臺值模型,包括冪函數(shù)模型、線性無基臺值模型、拋物線模型;第3類是孔穴效應(yīng)模型。下面有代表性地介紹幾種常見的變異函數(shù)理論模型。變異函數(shù)的理論模型地統(tǒng)計(jì)學(xué)將變異函數(shù)理論模型分為3大類:61①純塊金效應(yīng)模型:其一般公式為式中:c0>0,為先驗(yàn)方差。該模型相當(dāng)于區(qū)域化變量為隨機(jī)分布,樣本點(diǎn)間的協(xié)方差函數(shù)對于所有距離h均等于0,變量的空間相關(guān)不存在。
(4.2.11)①純塊金效應(yīng)模型:其一般公式為(4.2.11)62②球狀模型:其一般公式為
式中:c0為塊金(效應(yīng))常數(shù);c為拱高;c0+c為基臺值;a為變程。當(dāng)c0=0,c=1時(shí),稱為標(biāo)準(zhǔn)球狀模型。球狀模型是地統(tǒng)計(jì)分析中應(yīng)用最廣泛的理論模型,許多區(qū)域化變量的理論模型都可以用該模型去擬合。
(4.2.12)②球狀模型:其一般公式為(4.2.12)63③指數(shù)模型:其一般公式為式中:c0和c意義與前相同,但a不是變程。當(dāng)h=3α?xí)r,,即,從而指數(shù)模型的變程約為約為3a。當(dāng)c0=0,c=1時(shí),稱為標(biāo)準(zhǔn)指數(shù)模型。(4.2.13)③指數(shù)模型:其一般公式為(4.2.13)64④高斯模型:其一般公式為式中:c0和c意義與前相同,a也不是變程。當(dāng)時(shí),,即,因此高斯模型的變程約為。當(dāng)時(shí),稱為標(biāo)準(zhǔn)高斯函數(shù)模型。(4.2.14)④高斯模型:其一般公式為(4.2.14)65⑤冪函數(shù)模型:其一般公式為式中:θ為冪指數(shù)。當(dāng)θ變化時(shí),這種模型可以反映在原點(diǎn)附近的各種性狀。但是θ必須小于2,若,則函數(shù)就不再是一個(gè)條件非負(fù)定函數(shù)了,也就是說它已經(jīng)不能成為變異函數(shù)了。
(4.2.15)⑤冪函數(shù)模型:其一般公式為(4.2.15)66⑥對數(shù)模型:其一般公式為顯然,當(dāng),這與變異函數(shù)的性質(zhì)不符。因此,對數(shù)模型不能描述點(diǎn)支撐上的區(qū)域化變量的結(jié)構(gòu)。(4.2.16)⑥對數(shù)模型:其一般公式為(4.2.16)67⑦線性有基臺值模型:其一般公式為
式中:該模型的變程為a,基臺值為。
⑧線性無基臺值模型:其一般公式為
從式中可以看出,該模型沒有基臺值,也沒有變程。
(4.2.18)(4.2.17)⑦線性有基臺值模型:其一般公式為(4.2.18)(4.268空間統(tǒng)計(jì)分析方法ppt課件69例如:某地區(qū)降水量是一個(gè)區(qū)域化變量,其變異函數(shù)的實(shí)測值及距離h的關(guān)系見下表,下面我們試用回歸分析方法建立其球狀變異函數(shù)模型。實(shí)測值γ(h)距離h實(shí)測值γ(h)距離h2.10.69.24.94.31.110.35.15.72.210.56.26.52.510.97.57.83.111.29.58.83.812.49.8例如:某地區(qū)降水量是一個(gè)區(qū)域化變量,其變異函數(shù)的實(shí)測70
從上面的介紹和討論,我們知道,球狀變異函數(shù)的一般形式為當(dāng)時(shí),有從上面的介紹和討論,我們知道,球狀變異函數(shù)的一般形式71
如果記,則可以得到線性模型
根據(jù)表中的數(shù)據(jù),對上式進(jìn)行最小二乘擬合,得到
(4.2.20)
計(jì)算可知,上式的顯著性檢驗(yàn)參數(shù)F=114.054,R2=0.962,可見模型的擬合效果是很好的。(4.2.19)如果記72
比較(4.2.20)式與(4.2.19)式,并做簡單計(jì)算可知:c0=2.048,c=1.154,a=8.353,所以,球狀變異函數(shù)模型為(4.2.21)比較(4.2.20)式與(4.2.19)式,并做簡73
(四)克立格插值方法
克立格(Kriging)插值法,又稱空間局部估計(jì)或空間局部插值法。它建立在變異函數(shù)理論及結(jié)構(gòu)分析基礎(chǔ)之上的,在有限區(qū)域內(nèi)對區(qū)域化變量的取值進(jìn)行無偏最優(yōu)估計(jì)的一種方法??肆⒏穹ㄟm用的條件是,如果變異函數(shù)和相關(guān)分析的結(jié)果表明區(qū)域化變量存在空間相關(guān)性。其實(shí)質(zhì)是利用區(qū)域化變量的原始數(shù)據(jù)和變異函數(shù)的結(jié)構(gòu)特點(diǎn),對未采樣點(diǎn)的區(qū)域化變量的取值進(jìn)行線性無偏、最優(yōu)估計(jì)。具體來說,它是根據(jù)待估樣點(diǎn)(或待估塊段)有限鄰域內(nèi)若干已測定的樣點(diǎn)數(shù)據(jù),在認(rèn)真考慮樣點(diǎn)的形狀、大小和空間相互位置關(guān)系,它們與待估樣點(diǎn)相互空間位置關(guān)系,以及變異函數(shù)提供的結(jié)構(gòu)信息之后,對該待估樣點(diǎn)值進(jìn)行的一種線性無偏最優(yōu)估計(jì)。(四)克立格插值方法克立格(Kriging)插值74
克立格插值(kriginginterpolation)是根據(jù)變異函數(shù)模型而發(fā)展起來的一系列地統(tǒng)計(jì)的空間插值方法,包括:普通克立格法(ordinarykriging);
泛克立格法(universalkriging);
指示克立格法(indicatorkriging);
析取克立格法(disjunctivekriging);
協(xié)同克立格法(cokriging)等。下面僅對普通克立格法作一些簡單介紹??肆⒏癫逯担╧riginginter75
首先假設(shè)區(qū)域化變量滿足二階平穩(wěn)假設(shè)和本征假設(shè),其數(shù)學(xué)期望為m,協(xié)方差函數(shù)及變異函數(shù)存在。即
假設(shè)在待估計(jì)點(diǎn)(x)的臨域內(nèi)共有n個(gè)實(shí)測點(diǎn),即x1,x2,…,xn,其樣本值為。那么,普通克里格法的插值公式為
(4.2.22)首先假設(shè)區(qū)域化變量76
其中為權(quán)重系數(shù),表示各空間樣本點(diǎn)處的觀測值對估計(jì)值的貢獻(xiàn)程度。可見,克立格插值的關(guān)鍵就是計(jì)算權(quán)重系數(shù)。顯然,權(quán)重系數(shù)的求取必須滿足兩個(gè)條件:一是使的估計(jì)是無偏的,即偏差的數(shù)學(xué)期望為零;二是最優(yōu)的,即使估計(jì)值和實(shí)際值之差的平方和最小。為此,需要滿足以下兩個(gè)條件:其中為權(quán)重系數(shù),表示各空間樣本點(diǎn)處77
(1)無偏性。要使成為的無偏估計(jì)量,即。
當(dāng)時(shí),也就是當(dāng)時(shí),則有這時(shí),為的無偏估計(jì)量。(2)最優(yōu)性。在滿足無偏性條件下,估計(jì)方差為(4.2.23)(1)無偏性。要使成為的無782.應(yīng)用實(shí)例
年降水量和蒸發(fā)量,既服從地帶性規(guī)律,同時(shí)又受隨機(jī)性因素的影響,因此它們是典型的區(qū)域化變量。我們以甘肅省53個(gè)氣象臺站多年平均降水量和蒸發(fā)量數(shù)據(jù)為實(shí)測值,擬合了年降水量和蒸發(fā)量的半變異函數(shù)理論模型,并采用普通克立格法和雙變量協(xié)同克里格法,做了空間插值計(jì)算,結(jié)論如下。
2.應(yīng)用實(shí)例年降水量和蒸發(fā)量,既服從地帶性規(guī)79
(一)半變異函數(shù)半變異函數(shù)模型,是克立格空間插值的前提條件,同時(shí)它也決定著空間插值的精度。一般情況下,半變異函數(shù)模型是根據(jù)半變異函數(shù)云圖的分布,選擇合適的理論模型,按照估計(jì)方差最小的原則,運(yùn)用最小二乘法求得。圖4.2.4和圖4.2.5分別給出了年降水量和年蒸發(fā)量的半變異函數(shù)云圖。
圖4.2.4年降水量的半變異函數(shù)云圖
圖4.2.4年降水量的半變異函數(shù)云圖
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學(xué)年河南新高中創(chuàng)新聯(lián)盟TOP二十名校高三上學(xué)期化學(xué)試題及答案
- 財(cái)務(wù)報(bào)表分析 教案 項(xiàng)目三 利潤表分析
- 三年級數(shù)學(xué)(上)計(jì)算題專項(xiàng)練習(xí)附答案
- 湘版九年級音樂上冊教案全集
- 二年級語文上冊教學(xué)設(shè)計(jì)
- 《電氣控制系統(tǒng)設(shè)計(jì)與裝調(diào)》教案 項(xiàng)目六 任務(wù)一:中間繼電器
- 陜西省咸陽市實(shí)驗(yàn)中學(xué)2024-2025學(xué)年八年級上學(xué)期第二次質(zhì)量檢測地理試卷(含答案)
- 發(fā)光門牌市場發(fā)展預(yù)測和趨勢分析
- 微笑服務(wù)培訓(xùn)
- 女用陽傘產(chǎn)業(yè)規(guī)劃專項(xiàng)研究報(bào)告
- (2024年)特種設(shè)備安全法律法規(guī)培訓(xùn)課件
- 2024年1月法律文書寫作試題與答案
- 小班數(shù)學(xué)活動(dòng)《按顏色分類》課件
- 建材銷售掛靠合同協(xié)議書模板
- 醫(yī)療器械投標(biāo)流程
- 試卷講評課-課件
- 高校物業(yè)物業(yè)管理服務(wù)內(nèi)容及標(biāo)準(zhǔn)
- 有效的員工離職與替補(bǔ)計(jì)劃
- 售后服務(wù)的重要價(jià)值
- 2024AIGC視頻生成:走向AI創(chuàng)生時(shí)代:視頻生成的技術(shù)演進(jìn)、范式重塑與商業(yè)化路徑探索
- 素養(yǎng)本位下的高中數(shù)學(xué)大單元整體教學(xué)設(shè)計(jì)實(shí)踐研究
評論
0/150
提交評論