地理信息系統(tǒng)理論方法及應(yīng)用05GIS中的數(shù)據(jù)_第1頁
地理信息系統(tǒng)理論方法及應(yīng)用05GIS中的數(shù)據(jù)_第2頁
地理信息系統(tǒng)理論方法及應(yīng)用05GIS中的數(shù)據(jù)_第3頁
地理信息系統(tǒng)理論方法及應(yīng)用05GIS中的數(shù)據(jù)_第4頁
地理信息系統(tǒng)理論方法及應(yīng)用05GIS中的數(shù)據(jù)_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、0(0),1(1),2(10),3(11),4(100),5(101),6(110),7(111),8(1000),9(1001)阿拉伯?dāng)?shù)字及其二級(jí)制表示第五章 GIS中的數(shù)據(jù)導(dǎo)讀:對(duì)空間數(shù)據(jù)的處理是GIS的核心功能,GIS中的數(shù)據(jù)通常描述三部分信息:空間信息(位置,空間關(guān)系等等),非空間的屬性信息,時(shí)間信息。數(shù)據(jù)按照其測(cè)量尺度,可以分為定名、定比、間隔、比率量四種類型。由于各方面的原因,GIS數(shù)據(jù)存在著質(zhì)量問題,了解數(shù)據(jù)質(zhì)量有利于數(shù)據(jù)的正確使用,避免出現(xiàn)“Garbage In, Garbage Out”的情形。數(shù)據(jù)質(zhì)量可以通過元數(shù)據(jù)進(jìn)行描述,簡(jiǎn)單的說,元數(shù)據(jù)是對(duì)數(shù)據(jù)的描述,在GIS應(yīng)用不斷發(fā)

2、展、空間數(shù)據(jù)不斷增長(zhǎng)的情況下,元數(shù)據(jù)有助于數(shù)據(jù)的共享和有效使用。本章講述了上述的內(nèi)容。1數(shù)據(jù)涵義與數(shù)據(jù)類型11數(shù)據(jù)的涵義111數(shù)據(jù)數(shù)據(jù)是用以載荷信息的載體。它可以是記錄下來的某種可以識(shí)別的物理符號(hào),數(shù)據(jù)的具體形式多種多樣,如文本、圖像、聲音等都可以歸入數(shù)據(jù)的范疇。雖然數(shù)據(jù)是信息的載體,但并非就是信息,只有理解了數(shù)據(jù)的含義、對(duì)數(shù)據(jù)做出解釋,才能得到數(shù)據(jù)中所包含的信息。在計(jì)算機(jī)化的信息系統(tǒng)中,數(shù)據(jù)的格式往往與具體的計(jì)算機(jī)系統(tǒng)有關(guān),隨著載荷它的物理設(shè)備的形式而改變。信息系統(tǒng)對(duì)數(shù)據(jù)進(jìn)行處理(運(yùn)算、排序、編碼、分類、增強(qiáng)等)就是為了得到數(shù)據(jù)中所包含的信息。在地理信息系統(tǒng)中,由系統(tǒng)建立者輸入、機(jī)器存儲(chǔ)的各

3、種專題地圖和統(tǒng)計(jì)圖表是數(shù)據(jù);系統(tǒng)軟件中所包含的代碼是計(jì)算機(jī)系統(tǒng)中的二進(jìn)制數(shù)據(jù);用戶對(duì)地理信息系統(tǒng)發(fā)出的各種指令也是數(shù)據(jù),等等。因此,地理信息系統(tǒng)的建立和運(yùn)行,就是信息或數(shù)據(jù)按一定的方式流動(dòng)的過程。數(shù)據(jù)的處理和解釋是非常重要的環(huán)節(jié)。所謂數(shù)據(jù)處理,是指對(duì)數(shù)據(jù)進(jìn)行收集、篩選、排序、歸并、轉(zhuǎn)換、檢索、計(jì)算以及分析、模擬和預(yù)測(cè)的操作,其目的就是把數(shù)據(jù)轉(zhuǎn)換成便于觀察、分析、傳輸或進(jìn)一步處理的形式;把數(shù)據(jù)加工成對(duì)正確管理和決策有用的數(shù)據(jù);把數(shù)據(jù)編輯后存儲(chǔ)起來,以供不斷使用。數(shù)據(jù)處理是為了解釋,而數(shù)據(jù)解釋需要人的智慧、學(xué)識(shí)和經(jīng)驗(yàn)。112地理數(shù)據(jù)(空間數(shù)據(jù))的基本特征地理數(shù)據(jù)一般具有三個(gè)基本特征:屬性特征(非定

4、位數(shù)據(jù)),表示實(shí)際現(xiàn)象或特征,例如變量、級(jí)別、數(shù)量特征和名稱等等。空間特征(定位數(shù)據(jù)):表示現(xiàn)象的空間位置或現(xiàn)在所處的地理位置。空間特征又稱為幾何特征或定位特征,一般以坐標(biāo)數(shù)據(jù)表示,例如笛卡爾坐標(biāo)等。時(shí)間特征(時(shí)間尺度):指現(xiàn)象或物體隨時(shí)間的變化,其變化的周期有超短期的、短期的、中期的、長(zhǎng)期的等等(圖5-1)。圖5-1:空間數(shù)據(jù)的基本特性Jack Dangermond,198412空間數(shù)據(jù)的類型在地理信息系統(tǒng)中,按照其特征,數(shù)據(jù)可分為三種類型:空間特征數(shù)據(jù)(定位數(shù)據(jù))、時(shí)間屬性數(shù)據(jù)(尺度數(shù)據(jù))和專題屬性數(shù)據(jù)(非定位數(shù)據(jù))。對(duì)于絕大部分地理信息系統(tǒng)的應(yīng)用來說,時(shí)間和專題屬性數(shù)據(jù)結(jié)合在一起共同作為

5、屬性特征數(shù)據(jù),而空間特征數(shù)據(jù)和屬性特征數(shù)據(jù)統(tǒng)稱為空間數(shù)據(jù)(或地理數(shù)據(jù))。121空間特征數(shù)據(jù)空間特征數(shù)據(jù)記錄的是空間實(shí)體的位置、拓?fù)潢P(guān)系和幾何特征,這是地理信息系統(tǒng)區(qū)別于其他數(shù)據(jù)庫管理系統(tǒng)的標(biāo)志??臻g特征指空間物體的位置、形狀和大小等幾何特征,以及與相鄰物體的拓?fù)潢P(guān)系。位置和拓?fù)涮卣魇堑乩砘蚩臻g信息系統(tǒng)所獨(dú)有的,空間位置可以由不同的坐標(biāo)系統(tǒng)來描述,如經(jīng)緯度坐標(biāo)、一些標(biāo)準(zhǔn)的地圖投影坐標(biāo)或是任意的直角坐標(biāo)等。人類對(duì)空間目標(biāo)的定位一般不是通過記憶其空間坐標(biāo),而是確定某一目標(biāo)與其他更熟悉的目標(biāo)間的空間位置關(guān)系,而這種關(guān)系往往也是拓?fù)潢P(guān)系。如一所學(xué)校位于哪個(gè)路口或哪條街道。122專題特征數(shù)據(jù)專題特征指的是

6、地理實(shí)體所具有的各種性質(zhì),如地形的坡度、坡向、某地的年降雨量、土地酸緘類型、人口密度、交通流量、空氣污染程度等。這類特征在其他類型的信息系統(tǒng)中均可存儲(chǔ)和處理。專題屬性特征通常以數(shù)字、符號(hào)、文本和圖像等形式來表示。123時(shí)間特征數(shù)據(jù)時(shí)間屬性是指地理實(shí)體的時(shí)間變化或數(shù)據(jù)采集的時(shí)間等。嚴(yán)格地講,空間數(shù)據(jù)總是在某一特定時(shí)間或時(shí)段內(nèi)采集得到或計(jì)算產(chǎn)生的。由于有些空間數(shù)據(jù)隨時(shí)間變化相對(duì)較慢,因而有時(shí)被忽略;有些時(shí)候,時(shí)間可以被看成一個(gè)專題特征。13空間數(shù)據(jù)的表示方法一般地,表示地理現(xiàn)象的空間數(shù)據(jù)可以細(xì)分為:類型數(shù)據(jù):例如考古地點(diǎn)、道路線和土壤類型的分布等;面域數(shù)據(jù):例如隨機(jī)多邊形的中心點(diǎn)、行政區(qū)域界線和行

7、政單元等;網(wǎng)絡(luò)數(shù)據(jù):例如道路交點(diǎn)、街道和街區(qū)等;樣本數(shù)據(jù):例如氣象站、航線和野外樣方的分布區(qū)等;曲面數(shù)據(jù):例如高程點(diǎn)、等高線和等值區(qū)域;文本數(shù)據(jù):例如地名、河流名稱和區(qū)域名稱;符號(hào)數(shù)據(jù):例如點(diǎn)狀符號(hào)、線狀符號(hào)和面狀符號(hào)(暈線)等(如圖5-2所示)。圖5-2:地理信息系統(tǒng)中各種數(shù)據(jù)以及其表現(xiàn)2數(shù)據(jù)的測(cè)量尺度對(duì)特定現(xiàn)象的測(cè)量就是根據(jù)一定的標(biāo)準(zhǔn)對(duì)其賦值或打分。為了描述地理世界,對(duì)任何事物都要鑒別、分類和命名。這些都是量測(cè)的組成部分。它們所使用的參考標(biāo)準(zhǔn)或尺度是不同的。測(cè)量的尺度大致可以分成四個(gè)層次,由粗略至詳細(xì)依次為:命名或類型、次序、間隔以及比例。21命名(Nominal)量定性而非定量,不能進(jìn)行

8、任何算術(shù)運(yùn)算,如一個(gè)城市的名字。命名式的測(cè)量尺度也稱為類型測(cè)量尺度,只對(duì)特定現(xiàn)象進(jìn)行標(biāo)識(shí),賦予一定的數(shù)值或符號(hào)而不定量描述。例如,可以用不同數(shù)值表示不同的土地利用類型、植被類型或巖石類型,但是這些數(shù)值之間無數(shù)量關(guān)系,對(duì)命名數(shù)據(jù)的邏輯運(yùn)算只有“等于”或“不等于”兩種形式,而其近似均值只能使用眾數(shù)。22次序(Ordinal)量線性坐標(biāo)上不按值的大小,而是按順序排列的數(shù),例如,事故發(fā)生危險(xiǎn)程度的級(jí)別由大到小被標(biāo)為1,2,3,級(jí)別的序號(hào)越低,其危險(xiǎn)性越大,但危險(xiǎn)性到底有多大并未給予定量的表達(dá)。序數(shù)值相互之間可以比較大小,但不能進(jìn)行加、減、乘、除等算術(shù)運(yùn)算。次序測(cè)量尺度是基于對(duì)現(xiàn)象進(jìn)行排序來標(biāo)識(shí)的,如可

9、以把山峰按高度分級(jí)為極高山、高山、中山、低山和丘陵等,將坡度分為陡、中、緩等。不同次序之間的間隔大小可以不同。對(duì)次序數(shù)據(jù)的邏輯運(yùn)算除了“等于”與“不等于”之外,還可以比較它們的大小,即“大于”或“小于”。23間隔(Interval)量不參照某個(gè)固定點(diǎn),而是按間隔表示相對(duì)位置的數(shù)。按間隔量測(cè)的值相互之間可以比較大小,并且它們之間的差值大小是有意義的。間隔測(cè)量尺度與比例測(cè)量尺度相似,但是間隔尺度的測(cè)量值無真的零值。例如,溫度是間隔尺度的數(shù)據(jù)而不是比例數(shù)據(jù),因?yàn)樗摹?”測(cè)量值隨著所使用的不同溫度測(cè)量單位而不同。不能說150F的溫度是75F的溫度的兩倍,因?yàn)檫@個(gè)比例在使用攝氏單位時(shí)就改變了。相反,降

10、水量是比例數(shù)據(jù),因?yàn)樗姓娴牧阒? 與比率量不同,間隔量中的零值往往是人為規(guī)定的,如攝氏溫標(biāo)中零攝氏度,時(shí)間中的零點(diǎn)等等。比例數(shù)據(jù)和間隔數(shù)據(jù)可用于加、減、乘、除等運(yùn)算,而且可以求算術(shù)平均。24比率(Ratio)量比例測(cè)量尺度的測(cè)量值指那些有真零值而且測(cè)量單位的間隔是相等的數(shù)據(jù),比例測(cè)量尺度與使用的測(cè)量單位無關(guān)。與某一固定點(diǎn)的比值計(jì)算,支持多種算術(shù)操作,如加、減、乘、除等。有關(guān)該類型屬性域的例子很多,如年降雨量、海拔高度、人口密度、發(fā)病率等。比例數(shù)據(jù)或間隔數(shù)據(jù)可以比較容易地被轉(zhuǎn)變成次序或命名數(shù)據(jù)。而命名數(shù)據(jù)則很難被轉(zhuǎn)化成次序、間隔數(shù)據(jù)或比例數(shù)據(jù)。由此可見,盡管命名數(shù)據(jù)或次序數(shù)據(jù)便于使用,易于理解

11、,但有時(shí)不夠精確,不能用于較高級(jí)的算術(shù)運(yùn)算。而比例數(shù)據(jù)或間隔數(shù)據(jù)比較精確,便于計(jì)算機(jī)處理,但是在較復(fù)雜的GIS應(yīng)用中,往往上述幾種測(cè)量尺度的數(shù)據(jù)均需用到。圖5-3:各種數(shù)據(jù)測(cè)量尺度以及其制圖表現(xiàn)3地理信息系統(tǒng)的數(shù)據(jù)質(zhì)量地理信息系統(tǒng)是一個(gè)基于計(jì)算機(jī)軟件、硬件和數(shù)據(jù)的集成系統(tǒng),該系統(tǒng)主要通過空間及非空間數(shù)據(jù)的操作,實(shí)現(xiàn)空間檢索、編輯及分析功能。在GIS的幾個(gè)主要因素中,數(shù)據(jù)是一個(gè)極為重要的因素。在計(jì)算機(jī)軟件、硬件環(huán)境選定之后,GIS中數(shù)據(jù)質(zhì)量的優(yōu)劣,決定著系統(tǒng)分析質(zhì)量以及整個(gè)應(yīng)用的成敗。GIS提供的空間數(shù)據(jù)的分析方法被廣泛用于各種領(lǐng)域,用于決策領(lǐng)域的數(shù)據(jù),其質(zhì)量要求應(yīng)該是可知的或可預(yù)測(cè)的。31數(shù)據(jù)

12、質(zhì)量的基本概念311準(zhǔn)確性(Accuracy)即一個(gè)記錄值(測(cè)量或觀察值)與它的真實(shí)值之間的接近程度。這個(gè)概念是相當(dāng)抽象的,似乎人們已經(jīng)知道存在這樣的事實(shí)。在實(shí)際中,測(cè)量的知識(shí)可能依賴于測(cè)量的類型和比例尺。一般而言,單個(gè)的觀察或測(cè)量的準(zhǔn)確性的估價(jià)僅僅是通過與可獲得的最準(zhǔn)確的測(cè)量或公認(rèn)的分類進(jìn)行比較??臻g數(shù)據(jù)的準(zhǔn)確性經(jīng)常是根據(jù)所指的位置、拓?fù)浠蚍强臻g屬性來分類的。它可用誤差(Error)來衡量。312精度(Precision)即對(duì)現(xiàn)象描述的詳細(xì)程度。如對(duì)同樣的兩點(diǎn),精度低的數(shù)據(jù)并不一定準(zhǔn)確度也低。精度要求測(cè)量能以最好的準(zhǔn)確性來記錄,但是這可能誤導(dǎo)提供了較大的精度,因?yàn)槌鲆粋€(gè)測(cè)量?jī)x器的已知準(zhǔn)確度

13、的數(shù)字在效率上是冗于的。因此,如果手工操作的數(shù)字化板所返回的坐標(biāo)不可能依賴于比0.1mm還要準(zhǔn)確的一個(gè)“真正的”數(shù)值,那么就不存在任何的點(diǎn),在十分之一的地方是以mm表示的。313空間分辨率(Spatial Resolution)分辨率是兩個(gè)可測(cè)量數(shù)值之間最小的可辯識(shí)的差異。那么空間分辨率可以看作記錄變化的最小距離。在一張用肉眼可讀的地圖上,假設(shè)一條線用來記錄一個(gè)邊界,分辨率通常由最小線的寬度來確定。地圖上的線很少以小于0.1mm的寬度來畫。在一個(gè)圖形掃描儀中最細(xì)的物理分辨率從理論上講是由設(shè)施的像元之間的分離來確定的。在一個(gè)激光打印機(jī)上這是一英寸的300分之一,而且在高質(zhì)量的激光掃描儀上,這會(huì)細(xì)

14、化十倍。如果沒有放大,最細(xì)的激光掃描儀的線是看不到的,盡管這依賴于背景顏色的對(duì)照。因此,在人的視覺分辨率和設(shè)備物理分辨率之間存在著一個(gè)差異。一個(gè)相似的區(qū)別可以存在于兩個(gè)最小距離之間,即當(dāng)人操作者操作數(shù)字化儀時(shí)所區(qū)別的最小距離和數(shù)字化儀硬件可以不斷地報(bào)告的最小距離。314比例尺(Scale)比例尺是地圖上一個(gè)記錄的距離和它所表現(xiàn)的“真實(shí)世界的”距離之間的一個(gè)比例。地圖的比例尺將決定地圖上一條線的寬度所表現(xiàn)的地面的距離。例如,在一個(gè)1:10000比例尺的地圖上,一條0.5mm寬度的線對(duì)應(yīng)著5m的地面距離。如果這是線的最小的寬度,那么就不可能表示小于5m的現(xiàn)象。315誤差(Error)定義出一個(gè)所記

15、錄的測(cè)量和它的事實(shí)之間的準(zhǔn)確性以后,很明顯對(duì)于大多數(shù)目的而言,它的數(shù)值是不準(zhǔn)確的。誤差研究包括:位置誤差,即點(diǎn)的位置的誤差、線的位置的誤差和多邊形的位置的誤差;屬性誤差;位置和屬性誤差之間的關(guān)系。316不確定性(Uncertainty)地理信息系統(tǒng)的不確定性包括空間位置的不確定性、屬性不確定性、時(shí)域不確定性、邏輯上的不一致性及數(shù)據(jù)的不完整性??臻g位置的不確定性指GIS中某一被描述物體與其地面上真實(shí)物體位置上的差別;屬性不確定性是指某一物體在GIS中被描述的屬性與其真實(shí)的屬性之差別;時(shí)域不確定性是指在描述地理現(xiàn)象時(shí),時(shí)間描述上的差錯(cuò);邏輯上的不一致性指數(shù)據(jù)結(jié)構(gòu)內(nèi)部的不一致性,尤其是指拓?fù)溥壿嬌系?/p>

16、不一致性;數(shù)據(jù)的不完整性指對(duì)于給定的目標(biāo),GIS沒有盡可能完全地表達(dá)該物體。32空間數(shù)據(jù)質(zhì)量問題的來源從空間數(shù)據(jù)的形式表達(dá)到空間數(shù)據(jù)的生成,從空間數(shù)據(jù)的處理變換到空間數(shù)據(jù)的應(yīng)用,在這兩個(gè)過程中都會(huì)有數(shù)據(jù)質(zhì)量問題的發(fā)生。下面按照空間數(shù)據(jù)自身存在的規(guī)律性,從幾個(gè)方面來闡述空間數(shù)據(jù)質(zhì)量問題的來源。321空間現(xiàn)象自身存在的不穩(wěn)定性空間數(shù)據(jù)質(zhì)量問題首先來源于空間現(xiàn)象自身存在的不穩(wěn)定性。空間現(xiàn)象自身存在的不穩(wěn)定性包括空間特征和過程在空間、專題和時(shí)間內(nèi)容上的不確定性。空間現(xiàn)象在空間上的不確定性指其在空間位置分布上的不確定性變化;空間現(xiàn)象在時(shí)間上的不確定性表現(xiàn)為其在發(fā)生時(shí)間段上的游移性;空間現(xiàn)象在屬性上的不確

17、定性表現(xiàn)為屬性類型劃分的多樣性,非數(shù)值型屬性值表達(dá)的不精確性。因此,空間數(shù)據(jù)存在質(zhì)量問題是不可避免的。322空間現(xiàn)象的表達(dá)數(shù)據(jù)采集中的測(cè)量方法以及量測(cè)精度的選擇等受到人類自身的認(rèn)識(shí)和表達(dá)的影響,這對(duì)于數(shù)據(jù)的生成會(huì)出現(xiàn)誤差。如在地圖投影中,由橢球體到平面的投影轉(zhuǎn)換必然產(chǎn)生誤差;用于獲取各種原始數(shù)據(jù)的各種測(cè)量?jī)x器都有一定的設(shè)計(jì)精度,如GPS提供的地理位置數(shù)據(jù)都有用戶要求的一定設(shè)計(jì)精度,因而數(shù)據(jù)誤差的產(chǎn)生不可避免。323空間數(shù)據(jù)處理中的誤差在空間數(shù)據(jù)處理過程中,容易產(chǎn)生的誤差有以下幾種:投影變換:地圖投影是開口的三維地球橢球面到二維場(chǎng)平面的拓?fù)渥儞Q。在不同投影形式下,地理特征的位置、面積和方向的表現(xiàn)

18、會(huì)有差異。地圖數(shù)字化和掃描后的矢量化處理:數(shù)字化過程采點(diǎn)的位置精度、空間分辨率、屬性賦值等都可能出現(xiàn)誤差。數(shù)據(jù)格式轉(zhuǎn)換:在矢量格式和柵格格式之間的數(shù)據(jù)格式轉(zhuǎn)換中,數(shù)據(jù)所表達(dá)的空間特征的位置具有差異性。數(shù)據(jù)抽象:在數(shù)據(jù)發(fā)生比例尺變換時(shí),對(duì)數(shù)據(jù)進(jìn)行的聚類、歸并、合并等操作時(shí)產(chǎn)生的誤差,如知識(shí)性誤差和數(shù)據(jù)所表達(dá)的空間特征位置的變化誤差。建立拓?fù)潢P(guān)系:拓?fù)溥^程中伴隨有數(shù)據(jù)所表達(dá)的空間特征的位置坐標(biāo)的變化。與主控?cái)?shù)據(jù)層的匹配:一個(gè)數(shù)據(jù)庫中,常存儲(chǔ)同一地區(qū)的多層數(shù)據(jù)面,為保證各數(shù)據(jù)層之間空間位置的協(xié)調(diào)性,一般建立一個(gè)主控?cái)?shù)據(jù)層以控制其它數(shù)據(jù)層的邊界和控制點(diǎn)。在與主控?cái)?shù)據(jù)層匹配的過程中也會(huì)存在空間位移,導(dǎo)致

19、誤差。數(shù)據(jù)疊加操作和更新:數(shù)據(jù)在進(jìn)行疊加運(yùn)算以及數(shù)據(jù)更新時(shí),會(huì)產(chǎn)生空間位置和屬性值的差異。數(shù)據(jù)集成處理:指在來源不同、類型不同的各種數(shù)據(jù)集的相互操作過程中所產(chǎn)生的誤差。數(shù)據(jù)集成是包括數(shù)據(jù)預(yù)處理、數(shù)據(jù)集之間的相互運(yùn)算、數(shù)據(jù)表達(dá)等過程在內(nèi)的復(fù)雜過程,其中位置誤差、屬性誤差都會(huì)出現(xiàn)。數(shù)據(jù)的可視化表達(dá):數(shù)據(jù)在可視化表達(dá)過程中為適應(yīng)視覺效果,需對(duì)數(shù)據(jù)的空間特征位置、注記等進(jìn)行調(diào)整,由此產(chǎn)生數(shù)據(jù)表達(dá)上的誤差。數(shù)據(jù)處理過程中誤差的傳遞和擴(kuò)散:在數(shù)據(jù)處理的各個(gè)過程中,誤差是累計(jì)和擴(kuò)散的,前一過程的累計(jì)誤差可能成為下一個(gè)階段的誤差起源,從而導(dǎo)致新的誤差的產(chǎn)生。324空間數(shù)據(jù)使用中的誤差在空間數(shù)據(jù)使用的過程中也會(huì)

20、導(dǎo)致誤差的出現(xiàn),主要包括兩個(gè)方面:一是對(duì)數(shù)據(jù)的解釋過程,二是缺少文檔。對(duì)于同一種空間數(shù)據(jù)來說,不同用戶對(duì)它的內(nèi)容的解釋和理解可能不同,處理這類問題的方法是隨空間數(shù)據(jù)提供各種相關(guān)的文檔說明,如元數(shù)據(jù)。另外,缺少對(duì)某一地區(qū)不同來源的空間數(shù)據(jù)的說明,如缺少投影類型、數(shù)據(jù)定義等描述信息,這樣往往導(dǎo)致數(shù)據(jù)用戶對(duì)數(shù)據(jù)的隨意性使用而使誤差擴(kuò)散。表5-1:數(shù)據(jù)的主要誤差來源數(shù)據(jù)處理過程誤差來源數(shù)據(jù)搜集野外測(cè)量誤差:儀器誤差、記錄誤差遙感數(shù)據(jù)誤差:輻射和幾何糾正誤差、信息提取誤差地圖數(shù)據(jù)誤差:原始數(shù)據(jù)誤差、坐標(biāo)轉(zhuǎn)換、制圖綜合及印刷數(shù)據(jù)輸入數(shù)字化誤差:儀器誤差、操作誤差不同系統(tǒng)格式轉(zhuǎn)換誤差:柵格-矢量轉(zhuǎn)換、三角網(wǎng)

21、-等值線轉(zhuǎn)換數(shù)據(jù)存儲(chǔ)數(shù)值精度不夠空間精度不夠:每個(gè)格網(wǎng)點(diǎn)太大、地圖最小制圖單元太大數(shù)據(jù)處理分類間隔不合理多層數(shù)據(jù)疊合引起的誤差傳播:插值誤差、多源數(shù)據(jù)綜合分析誤差比例尺太小引起的誤差數(shù)據(jù)輸出輸出設(shè)備不精確引起的誤差輸出的媒介不穩(wěn)定造成的誤差數(shù)據(jù)使用對(duì)數(shù)據(jù)所包含的信息的誤解對(duì)數(shù)據(jù)信息使用不當(dāng)33常見空間數(shù)據(jù)的誤差分析GIS中的誤差是指GIS中數(shù)據(jù)表示與其現(xiàn)實(shí)世界本身的差別。數(shù)據(jù)誤差的類型可以是隨機(jī)的,也可以是系統(tǒng)的。歸納起來,數(shù)據(jù)的誤差主要有四大類,即幾何誤差、屬性誤差、時(shí)間誤差和邏輯誤差。在這幾種誤差中,屬性誤差和時(shí)間誤差與普通信息系統(tǒng)中的誤差概念是一致的,幾何誤差是地理信息系統(tǒng)所特有的,而幾

22、何誤差、屬性誤差和時(shí)間誤差都會(huì)造成邏輯誤差,因此下面主要討論邏輯誤差和幾何誤差。331誤差的類型1)邏輯誤差數(shù)據(jù)的不完整性是通過上述四類誤差反映出來的。事實(shí)上檢查邏輯誤差,有助于發(fā)現(xiàn)不完整的數(shù)據(jù)和其他三類誤差。對(duì)數(shù)據(jù)進(jìn)行質(zhì)量控制或質(zhì)量保證或質(zhì)量評(píng)價(jià),一般先從數(shù)據(jù)的邏輯性檢查入手。如圖5-4所示,其中橋或停車場(chǎng)等與道路是相接的,如果數(shù)據(jù)庫中只有橋或停車場(chǎng),而沒有與道路相連,則說明道路數(shù)據(jù)被遺漏,使數(shù)據(jù)不完整。圖5-4:各種邏輯誤差2)幾何誤差由于地圖是以二維平面坐標(biāo)表達(dá)位置,在二維平面上的幾何誤差主要反映在點(diǎn)和線上。(21)點(diǎn)誤差關(guān)于某點(diǎn)的點(diǎn)誤差即為測(cè)量位置(x,y)與其真實(shí)位置(x0,y0)的

23、差異。真實(shí)位置的測(cè)量方法比測(cè)量位置的要更加精確,如在野外使用高精度的GPS方法得到。點(diǎn)誤差可通過計(jì)算坐標(biāo)誤差和距離的方法得到。坐標(biāo)誤差定義為:x=x-x0y=y-y0為了衡量整個(gè)數(shù)據(jù)采集區(qū)域或制圖區(qū)域內(nèi)的點(diǎn)誤差,一般抽樣測(cè)算(x,y)。抽樣點(diǎn)應(yīng)隨機(jī)分布于數(shù)據(jù)采集區(qū)內(nèi),并具有代表性。這樣抽樣點(diǎn)越多,所測(cè)的誤差分布就越接近于點(diǎn)誤差的真實(shí)分布。(22)線誤差線在地理信息系統(tǒng)數(shù)據(jù)庫中既可表示線性現(xiàn)象,又可以通過連成的多邊形表示面狀現(xiàn)象。第一類是線上的點(diǎn)在真實(shí)世界中是可以找到的,如道路、河流、行政界線等,這類的線性特征的誤差主要產(chǎn)生于測(cè)量和對(duì)數(shù)據(jù)的后處理;第二類是現(xiàn)實(shí)世界中找不到的,如按數(shù)學(xué)投影定義的經(jīng)

24、緯線、按高程繪制的等高線,或者是氣候區(qū)劃線和土壤類型界限等,這類線性特征的線誤差及在確定線的界限時(shí)的誤差,被稱為解譯誤差。解譯誤差與屬性誤差直接相關(guān),若沒有屬性誤差,則可以認(rèn)為那些類型界線是準(zhǔn)確的,因而解譯誤差為零。另外,線分為直線、折線、曲線與直線混合的線(圖5-5)。GIS數(shù)據(jù)庫中用兩種方法表達(dá)曲線、折線,圖5-6對(duì)這兩類誤差作了對(duì)照。圖5-5:各種線(直線、折線、曲線)圖5-6:折線和曲線的誤差線誤差分布可以用Epsilon帶模型來描述,它由沿著一條線以及兩側(cè)定寬的帶構(gòu)成,真實(shí)的線以某一概率落于Epsilon帶內(nèi)。Epsilon帶是等寬的(類似于后面講述的緩沖區(qū),不過其意義不同),在此基

25、礎(chǔ)上,誤差帶模型被提出,與Epsilon帶模型相比,它在中間最窄而在兩端較寬?;谡`差帶模型,可以把直線與折線誤差分布的特點(diǎn)分別看作是“骨頭型”或者“車鏈型”的誤差分布帶模式(圖5-7)。圖5-7:折線誤差的分布對(duì)于曲線的誤差分布或許應(yīng)當(dāng)考慮“串腸型模式”(圖5-8)。圖5-8:曲線的誤差分布332地圖數(shù)據(jù)的質(zhì)量問題地圖數(shù)據(jù)是現(xiàn)有地圖經(jīng)過數(shù)字化或掃描處理后生成的數(shù)據(jù)。在地圖數(shù)據(jù)質(zhì)量問題中,不僅含有地圖固有的誤差,還包括圖紙變形、圖形數(shù)字化等誤差。1)地圖固有誤差:是指用于數(shù)字化的地圖本身所帶有的誤差,包括控制點(diǎn)誤差、投影誤差等。由于這些誤差間的關(guān)系很難確定,所以很難對(duì)其綜合誤差作出準(zhǔn)確評(píng)價(jià)。如

26、果假定綜合誤差與各類誤差間存在線性關(guān)系,即可用誤差傳播定律來計(jì)算綜合誤差。2)材料變形產(chǎn)生的誤差:這類誤差是由于圖紙的大小受濕度和溫度變化的影響而產(chǎn)生的。溫度不變的情況下,若濕度由0%增至25%,則紙的尺寸可能改變1.6%;紙的膨脹率和收縮率并不相同,即使?jié)穸扔只謴?fù)到原來的大小,圖紙也不能恢復(fù)原有的尺寸,一張6英寸的圖紙因濕度變化而產(chǎn)生的誤差可能高達(dá)0.576英寸。在印刷過程中,紙張先隨溫度的升高而變長(zhǎng)變寬,又由于冷卻而產(chǎn)生收縮。3)圖象數(shù)字化誤差:數(shù)字化方式主要有跟蹤數(shù)字化和掃描數(shù)字化兩種。跟蹤數(shù)字化一般有點(diǎn)方式和流方式兩種工作方式,前者在實(shí)際工作中使用較多,后者進(jìn)行數(shù)字化所產(chǎn)生的誤差要比前

27、者大得多。不同數(shù)據(jù)錄入方式對(duì)數(shù)據(jù)質(zhì)量的影響跟蹤數(shù)字化:影響其數(shù)據(jù)質(zhì)量的因素主要有:數(shù)字化要素對(duì)象、數(shù)字化操作人員、數(shù)字化儀和數(shù)字化操作。其中,數(shù)字化要素對(duì)象:地理要素圖形本身的高度、密度和復(fù)雜程度對(duì)數(shù)字化結(jié)果的質(zhì)量有著顯著影響,如粗線比細(xì)線更易引起誤差,復(fù)雜曲線比平直線更易引起誤差,密集的要素比稀疏的要素更易引起誤差等;數(shù)字化操作人員:數(shù)字化操作人員的技術(shù)與經(jīng)驗(yàn)不同,所引入的數(shù)字化誤差也會(huì)有較大的誤差,這主要表現(xiàn)在最佳采點(diǎn)點(diǎn)位的選擇、十字絲與目標(biāo)重疊程度的判斷能力等方面,另外,數(shù)字化操作人員的疲勞程度和數(shù)字化的速度也會(huì)影響數(shù)字化的質(zhì)量;數(shù)字化儀的分辨率和精度對(duì)數(shù)字化的質(zhì)量有著決定性的影響;數(shù)字

28、化操作方式也會(huì)影響到數(shù)字化數(shù)據(jù)的質(zhì)量,如曲線采點(diǎn)方式(流方式或點(diǎn)方式)和采點(diǎn)密度等。掃描數(shù)字化:掃描數(shù)字化采用高精度掃描儀將圖形、圖象等掃描并形成柵格數(shù)據(jù)文件,再利用掃描矢量化軟件對(duì)柵格數(shù)據(jù)文件進(jìn)行處理,將它轉(zhuǎn)換為矢量圖形數(shù)據(jù)。矢量化過程有兩種方式:即交互式和全自動(dòng)。影響掃描數(shù)字化數(shù)據(jù)質(zhì)量的因素包括原圖質(zhì)量(如清晰度)、掃描精度、掃描分辨率、配準(zhǔn)精度、校正精度等。333遙感數(shù)據(jù)的質(zhì)量問題遙感數(shù)據(jù)的質(zhì)量問題,一部分來自遙感儀器的觀測(cè)過程,一部分來自遙感圖象處理和解譯過程。遙感觀測(cè)過程本身存在著精確度和準(zhǔn)確度的限制,這一過程產(chǎn)生的誤差主要表現(xiàn)為空間分辨率、幾何畸變和輻射誤差,這些誤差將影響遙感數(shù)據(jù)

29、的位置和屬性精度。遙感圖像處理和解譯過程,主要產(chǎn)生空間位置和屬性方面的誤差。這是由圖像處理中的影像或圖像校正和匹配以及遙感解譯判讀和分類引入的,其中包括混合像元的解譯判讀所帶來的屬性誤差。334測(cè)量數(shù)據(jù)的質(zhì)量問題測(cè)量數(shù)據(jù)主要指使用大地測(cè)量、GPS、城市測(cè)量、攝影測(cè)量和其他一些測(cè)量方法直接量測(cè)所得到的測(cè)量對(duì)象的空間位置信息。這部分?jǐn)?shù)據(jù)質(zhì)量問題,主要是空間數(shù)據(jù)的位置誤差。空間數(shù)據(jù)的位置通常以坐標(biāo)表示,空間數(shù)據(jù)位置的坐標(biāo)與其經(jīng)緯度表示之間存在著某誤差因素,由于這種誤差因素?zé)o法排除,一般也不作為誤差考慮。測(cè)量方面的誤差通常考慮的是系統(tǒng)誤差、操作誤差和偶然誤差。系統(tǒng)誤差的發(fā)生與一個(gè)確定的系統(tǒng)有關(guān),它受環(huán)

30、境因素(如溫度、濕度和氣壓等)、儀器結(jié)構(gòu)與性能以及操作人員技能等方面的因素綜合影響而產(chǎn)生。系統(tǒng)誤差不能通過重復(fù)觀測(cè)加以檢查或消除,只能用數(shù)字模型模擬和估計(jì)。操作誤差是操作人員在使用設(shè)備、讀書或記錄觀測(cè)值時(shí),因粗心或操作不當(dāng)而產(chǎn)生的。應(yīng)采用各種方法檢查和消除操作誤差。一般地,操作誤差可通過簡(jiǎn)單的幾何關(guān)系或代數(shù)檢查驗(yàn)證其一致性,或通過重復(fù)觀測(cè)檢查并消除操作誤差。偶然誤差是一種隨機(jī)性的誤差,由一些不可測(cè)和不可控的因素引入。這種誤差具有一定的特征,如正負(fù)誤差出現(xiàn)頻率相同、大誤差少、小誤差多等。偶然誤差可采用隨機(jī)模型進(jìn)行估計(jì)和處理。34空間數(shù)據(jù)質(zhì)量控制數(shù)據(jù)質(zhì)量控制是個(gè)復(fù)雜的過程,要控制數(shù)據(jù)質(zhì)量應(yīng)從數(shù)據(jù)質(zhì)

31、量產(chǎn)生和擴(kuò)散的所有過程和環(huán)節(jié)入手,分別用一定的方法減少誤差??臻g數(shù)據(jù)質(zhì)量控制常見的方法有:341傳統(tǒng)的手工方法質(zhì)量控制的人工方法主要是將數(shù)字化數(shù)據(jù)與數(shù)據(jù)源進(jìn)行比較,圖形部分的檢查包括目視方法、繪制到透明圖上與原圖疊加比較,屬性部分的檢查采用與原屬性逐個(gè)對(duì)比或其他比較方法。342元數(shù)據(jù)方法數(shù)據(jù)集的元數(shù)據(jù)中包含了大量的有關(guān)數(shù)據(jù)質(zhì)量的信息,通過它可以檢查數(shù)據(jù)質(zhì)量,同時(shí)元數(shù)據(jù)也記錄了數(shù)據(jù)處理過程中質(zhì)量的變化,通過跟蹤元數(shù)據(jù)可以了解數(shù)據(jù)質(zhì)量的狀況和變化。343地理相關(guān)法用空間數(shù)據(jù)的地理特征要素自身的相關(guān)性來分析數(shù)據(jù)的質(zhì)量。如從地表自然特征的空間分布著手分析,山區(qū)河流應(yīng)位于微地形的最低點(diǎn),因此,疊加河流和

32、等高線兩層數(shù)據(jù)時(shí),如河流的位置不在等高線的外凸連線上,則說明兩層數(shù)據(jù)中必有一層數(shù)據(jù)有質(zhì)量問題,如不能確定哪層數(shù)據(jù)有問題時(shí),可以通過將它們分別與其它質(zhì)量可靠的數(shù)據(jù)層疊加來進(jìn)一步分析。因此,可以建立一個(gè)有關(guān)地理特征要素相關(guān)關(guān)系的知識(shí)庫,以備各空間數(shù)據(jù)層之間地理特征要素的相關(guān)分析之用。4空間數(shù)據(jù)的元數(shù)據(jù)Metadata可以譯成元數(shù)據(jù),是描述數(shù)據(jù)的數(shù)據(jù)。在地理空間數(shù)據(jù)中,元數(shù)據(jù)是說明數(shù)據(jù)內(nèi)容、質(zhì)量、狀況和其他有關(guān)特征的背景信息。元數(shù)據(jù)并不是一個(gè)新的概念。實(shí)際上傳統(tǒng)的圖書館卡片、出版圖書的版權(quán)說明、磁盤的標(biāo)簽等都是元數(shù)據(jù)。紙質(zhì)地圖的元數(shù)據(jù)主要表現(xiàn)為地圖類型、地圖圖例,包括圖名、空間參照系和圖廓坐標(biāo)、地圖

33、內(nèi)容說明、比例尺和精度、編制出版單位和日期或更新日期、銷售信息等。在這種形式下,元數(shù)據(jù)是可讀的,生產(chǎn)者和用戶之間容易交流,用戶通過它可以非常容易地確定該書或地圖是否能夠滿足其應(yīng)用的需要。隨著計(jì)算機(jī)技術(shù)和GIS技術(shù)發(fā)展,特別是網(wǎng)絡(luò)通信技術(shù)的發(fā)展,空間數(shù)據(jù)共享日益普遍。管理和訪問大型數(shù)據(jù)集的復(fù)雜性正成為數(shù)據(jù)生產(chǎn)者和用戶面臨的突出問題。數(shù)據(jù)生產(chǎn)者需要有效的數(shù)據(jù)管理和維護(hù)辦法;用戶需要找到更快、更加全面和有效的方法,以便發(fā)現(xiàn)、訪問、獲取和使用現(xiàn)勢(shì)性強(qiáng)、精度高、易管理和易訪問的地理空間數(shù)據(jù)。在這種情況下,空間數(shù)據(jù)的內(nèi)容、質(zhì)量、狀況等元數(shù)據(jù)信息變得更加重要,成為信息資源有效管理和應(yīng)用的重要手段。地理信息元

34、數(shù)據(jù)標(biāo)準(zhǔn)和操作工具已經(jīng)成為國(guó)家空間數(shù)據(jù)基礎(chǔ)設(shè)施* 國(guó)家空間數(shù)據(jù)基礎(chǔ)設(shè)施的具體描述見“地球信息科學(xué)與數(shù)字地球”一章。的一個(gè)重要組成部分。在地理信息系統(tǒng)應(yīng)用中,元數(shù)據(jù)的主要作用可以歸納為如下幾個(gè)方面:1)幫助數(shù)據(jù)生產(chǎn)單位有效地管理和維護(hù)空間數(shù)據(jù)、建立數(shù)據(jù)文檔,并保證即使其主要工作人員離退時(shí),也不會(huì)失去對(duì)數(shù)據(jù)情況的了解;2)提供有關(guān)數(shù)據(jù)生產(chǎn)單位數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分類、數(shù)據(jù)內(nèi)容、數(shù)據(jù)質(zhì)量、數(shù)據(jù)交換網(wǎng)絡(luò)及數(shù)據(jù)銷售等方面的信息,便于用戶查詢檢索地理空間數(shù)據(jù);3)幫助用戶了解數(shù)據(jù),以便就數(shù)據(jù)是否能滿足其需求做出正確的判斷;4)提供有關(guān)信息,以便用戶處理和轉(zhuǎn)換有用的數(shù)據(jù)。可見,元數(shù)據(jù)是使數(shù)據(jù)充分發(fā)揮作用的重要條件

35、之一,它可以用于許多方面,包括數(shù)據(jù)文檔建立、數(shù)據(jù)發(fā)布、數(shù)據(jù)瀏覽、數(shù)據(jù)轉(zhuǎn)換等。元數(shù)據(jù)對(duì)于促進(jìn)數(shù)據(jù)的管理、使用和共享均有重要的作用。41元數(shù)據(jù)的概念及類型411元數(shù)據(jù)的概念元數(shù)據(jù)是關(guān)于數(shù)據(jù)的描述性數(shù)據(jù)信息,它應(yīng)盡可能多地反映數(shù)據(jù)集自身的特征規(guī)律,以便于用戶對(duì)數(shù)據(jù)集的準(zhǔn)確、高效與充分的開發(fā)與利用,不同領(lǐng)域的數(shù)據(jù)庫,其元數(shù)據(jù)的內(nèi)容會(huì)有很大差異。通過元數(shù)據(jù)可以檢索、訪問數(shù)據(jù)庫,可以有效利用計(jì)算機(jī)的系統(tǒng)資源,可以對(duì)數(shù)據(jù)進(jìn)行加工處理和二次開發(fā)等。到目前為止,科學(xué)界關(guān)于元數(shù)據(jù)認(rèn)識(shí)的共同點(diǎn)是:元數(shù)據(jù)的目的就是促進(jìn)數(shù)據(jù)集的高效利用,并為計(jì)算機(jī)輔助軟件工程(CASE)服務(wù)。元數(shù)據(jù)的內(nèi)容包括:1)對(duì)數(shù)據(jù)集的描述;對(duì)數(shù)

36、據(jù)集中各數(shù)據(jù)項(xiàng)、數(shù)據(jù)來源、數(shù)據(jù)所有者及數(shù)據(jù)序代(數(shù)據(jù)生產(chǎn)歷史)等的說明;2)對(duì)數(shù)據(jù)質(zhì)量的描述,如數(shù)據(jù)精度、數(shù)據(jù)的邏輯一致性、數(shù)據(jù)完整性、分辨率、元數(shù)據(jù)的比例尺等;3)對(duì)數(shù)據(jù)處理信息的說明,如量綱的轉(zhuǎn)換等;4)對(duì)數(shù)據(jù)轉(zhuǎn)換方法的描述;5)對(duì)數(shù)據(jù)庫的更新、集成等的說明。412元數(shù)據(jù)的類型元數(shù)據(jù)的分類研究的目的在于充分了解和更好地使用元數(shù)據(jù)。分類的原則不同,元數(shù)據(jù)的分類體系和內(nèi)容將會(huì)有很大的差異。1)根據(jù)元數(shù)據(jù)的內(nèi)容分類由于不同性質(zhì)、不同領(lǐng)域的數(shù)據(jù)所需要的元數(shù)據(jù)內(nèi)容有差異,而且為不同應(yīng)用目的而建設(shè)的數(shù)據(jù)庫的元數(shù)據(jù)內(nèi)容會(huì)有很大的差異,所以將元數(shù)據(jù)化分為三種類型:(11)科研型元數(shù)據(jù):其主要目標(biāo)是幫助用戶

37、獲取各種來源的數(shù)據(jù)及其相關(guān)信息,它不僅包括如數(shù)據(jù)源名稱、作者、主體內(nèi)容等傳統(tǒng)的、圖書管理式的元數(shù)據(jù),還包含數(shù)據(jù)拓?fù)潢P(guān)系等。這類元數(shù)據(jù)的任務(wù)是幫助科研工作者高效獲取所需數(shù)據(jù)。(12)評(píng)估型元數(shù)據(jù):主要服務(wù)于數(shù)據(jù)利用的評(píng)價(jià),內(nèi)容包括數(shù)據(jù)最初收集情況、收集數(shù)據(jù)所用的儀器、數(shù)據(jù)獲取的方法和依據(jù)、數(shù)據(jù)處理過程和算法、數(shù)據(jù)質(zhì)量控制、采樣方法、數(shù)據(jù)精度、數(shù)據(jù)的可信度、數(shù)據(jù)潛在應(yīng)用領(lǐng)域等。(13)模型元數(shù)據(jù):用于描述數(shù)據(jù)模型的元數(shù)據(jù)與描述數(shù)據(jù)的元數(shù)據(jù)在結(jié)構(gòu)上大致相同,其內(nèi)容包括模型名稱、模型類型、建模過程、模型參數(shù)、邊界條件、作者、引用模型描述、建模使用軟件、模型輸出等。2)根據(jù)元數(shù)據(jù)描述對(duì)象分類(11)數(shù)據(jù)

38、層元數(shù)據(jù):指描述數(shù)據(jù)集中每個(gè)數(shù)據(jù)的元數(shù)據(jù),內(nèi)容包括日期郵戳、位置戳、量綱、注釋、誤差標(biāo)識(shí)、縮略標(biāo)識(shí)、存在問題標(biāo)識(shí)、數(shù)據(jù)處理過程等。(12)屬性元數(shù)據(jù):是關(guān)于屬性數(shù)據(jù)的元數(shù)據(jù),內(nèi)容包括為表達(dá)數(shù)據(jù)及其含義所建的數(shù)據(jù)字典、數(shù)據(jù)處理規(guī)則(協(xié)議),如采樣說明、數(shù)據(jù)傳輸線路及代數(shù)編碼等。(13)實(shí)體元數(shù)據(jù):是描述整個(gè)數(shù)據(jù)集的元數(shù)據(jù),內(nèi)容包括數(shù)據(jù)集區(qū)域采樣原則、數(shù)據(jù)庫的有效期、數(shù)據(jù)時(shí)間跨度等。3)根據(jù)元數(shù)據(jù)在系統(tǒng)中的作用分類(11)系統(tǒng)級(jí)別元數(shù)據(jù):指用于實(shí)現(xiàn)文件系統(tǒng)特征或管理文件系統(tǒng)中數(shù)據(jù)的信息,如訪問數(shù)據(jù)的時(shí)間、數(shù)據(jù)的大小、在存儲(chǔ)級(jí)別中的當(dāng)前位置、如何存儲(chǔ)數(shù)據(jù)塊以保證服務(wù)控制質(zhì)量等。(12)應(yīng)用層元數(shù)據(jù):

39、指有助于用戶查找、評(píng)估、訪問和管理數(shù)據(jù)等與數(shù)據(jù)用戶有關(guān)的信息,如文本文件內(nèi)容的摘要信息、圖形快照、描述與其它數(shù)據(jù)文件相關(guān)關(guān)系的信息。它往往用于高層次的數(shù)據(jù)管理,用戶通過它可以快速獲取合適的數(shù)據(jù)。4)根據(jù)元數(shù)據(jù)的作用分類(41)說明元數(shù)據(jù):是為用戶使用數(shù)據(jù)服務(wù)的元數(shù)據(jù)。它一般用自然語言表達(dá),如源數(shù)據(jù)覆蓋的空間范圍、源數(shù)據(jù)圖的投影方式及比例尺的大小、數(shù)據(jù)集說明文件等,這類元數(shù)據(jù)多為描述性信息,側(cè)重于數(shù)據(jù)庫的說明。(42)控制元數(shù)據(jù):是用于計(jì)算機(jī)操作流程控制的元數(shù)據(jù),這類元數(shù)據(jù)由一定的關(guān)鍵詞和特定的句法來實(shí)現(xiàn)。其內(nèi)容包括數(shù)據(jù)存儲(chǔ)和檢索文件、檢索中與目標(biāo)匹配方法、目標(biāo)的檢索和顯示、分析查詢結(jié)果排列顯示

40、、根據(jù)用戶要求修改數(shù)據(jù)庫中原有的內(nèi)部順序、數(shù)據(jù)轉(zhuǎn)換方法、空間數(shù)據(jù)和屬性數(shù)據(jù)的集成、根據(jù)索引項(xiàng)把數(shù)據(jù)繪制成圖、數(shù)據(jù)模型的建設(shè)和利用等。這類元數(shù)據(jù)主要是與數(shù)據(jù)庫操作有關(guān)的方法??臻g數(shù)據(jù)元數(shù)據(jù)中所用到的概念:空間數(shù)據(jù)(Geospatial Data):用于確定具有自然特征或者人工建筑特征的地理實(shí)體的地理位置、屬性及其邊界的信息;類型(Type):在元數(shù)據(jù)標(biāo)準(zhǔn)中,數(shù)據(jù)類型指該數(shù)據(jù)能接收的值的類型;對(duì)象(Object):對(duì)地理實(shí)體的部分或整體的數(shù)字表達(dá);實(shí)體類型(Entity Type):對(duì)于具有相似地理特征的地理實(shí)體集合的定義和描述;點(diǎn)(Point):用于位置確定的零維地理對(duì)象;結(jié)點(diǎn)(Node):拓?fù)?/p>

41、連接兩個(gè)或多個(gè)鏈或環(huán)的一維對(duì)象;標(biāo)識(shí)點(diǎn)(Label Point):顯示地圖后圖表時(shí)用于特征標(biāo)識(shí)的參考點(diǎn);線(Line):一維對(duì)象的一般術(shù)語;線段(Line Segment):兩個(gè)點(diǎn)之間的直線段;串(String):由相互連接的一系列線段組成的沒有分支線段的序列,它可與自身或與其它線相切;弧(Arc):由數(shù)學(xué)表達(dá)式確定的點(diǎn)集組成的弧狀曲線;鏈(Link):兩個(gè)結(jié)點(diǎn)之間的拓?fù)潢P(guān)聯(lián);鏈環(huán)(Chain):非相切線段或由結(jié)點(diǎn)區(qū)分的弧段構(gòu)成的有方向無分支序列;環(huán)(Ring):封閉狀不相切鏈環(huán)或弧段序列;多邊形(Ploygon):在二維平面中由封閉弧段包圍的區(qū)域;外多邊形(Universe Polygon)

42、:數(shù)據(jù)覆蓋區(qū)域內(nèi)最外側(cè)的多邊形,其面積是其它所有多邊形的面積之和;內(nèi)部區(qū)域(Interior Area):不包括其邊界的區(qū)域;格網(wǎng)(Grid):組成一規(guī)則或近似規(guī)則的棋盤狀鑲嵌表面的格網(wǎng)集合,或者組成一規(guī)則或近似規(guī)則的棋盤狀鑲嵌的點(diǎn)集合;格網(wǎng)單元(Grid Cell):表示格網(wǎng)最小分為要素的二維對(duì)象;矢量(Vector):有方向線的組合;柵格(Raster):同一格網(wǎng)或數(shù)字影像的一個(gè)或多個(gè)疊加層;像元(Pixel):二維圖形要素,它是數(shù)學(xué)影像最小要素;柵格對(duì)象(Raster Object):一個(gè)或多個(gè)影象或格網(wǎng),每個(gè)影象或格網(wǎng)表示一個(gè)數(shù)據(jù)層,各層之間相應(yīng)的格網(wǎng)單元或像元一致且相互套準(zhǔn);圖形(G

43、raph):與預(yù)定義的限制規(guī)則一致的零維(如node)、一維(link或chain)和二維(T多邊形)有拓?fù)湎嚓P(guān)的對(duì)象集;數(shù)據(jù)層(Layer):集成到一起的面域分布空間數(shù)據(jù)集,它用于表示一個(gè)主體中的實(shí)體,或者有一公共屬性或?qū)傩灾档目臻g對(duì)象的聯(lián)合;層(Stratum):在有序系統(tǒng)中數(shù)據(jù)層、級(jí)別或梯度序列;緯度(Latitude):在中央經(jīng)線上度量,以角度單位度量離開赤道的距離;經(jīng)度(Longitude):經(jīng)線面到格林尼治中央經(jīng)線面的角度距離;經(jīng)圈(Meridian):穿過地球兩極的地球的大圓圈;坐標(biāo)(Ordinate):在笛卡爾坐標(biāo)系中沿平行于X軸和Y軸測(cè)量的坐標(biāo)值;投影(Projection)

44、:將地球球面坐標(biāo)中的空間特征(集)轉(zhuǎn)化到平面坐標(biāo)體系時(shí)使用的數(shù)學(xué)轉(zhuǎn)化方法;投影參數(shù)(Projection Parameters):對(duì)數(shù)據(jù)集進(jìn)行投影操作時(shí)用于控制投影誤差、變形實(shí)際分布的參考特征;地圖(Map):空間現(xiàn)象的空間表征,通常以平面圖形表示;現(xiàn)象(Phenomenon):事實(shí)、發(fā)生的事件、狀態(tài)等;分辨率(Resolution):由涉及到或使用的測(cè)量工具或分析方法能區(qū)分開的兩個(gè)獨(dú)立測(cè)量或計(jì)算的值的最小差值;質(zhì)量(Quality):數(shù)據(jù)符合一定使用要求的基本或獨(dú)特的性質(zhì);詳述(Explicit):由一對(duì)數(shù)或三個(gè)數(shù)分別直接描述水平位置和三維位置的方法;介質(zhì)(Media):用于記錄、存儲(chǔ)或傳遞

45、數(shù)據(jù)的物理設(shè)備。413空間數(shù)據(jù)元數(shù)據(jù)的標(biāo)準(zhǔn)同物理、化學(xué)等學(xué)科使用的數(shù)據(jù)結(jié)構(gòu)類型相比,空間數(shù)據(jù)是一種結(jié)構(gòu)比較復(fù)雜的數(shù)據(jù)類型。它涉及到對(duì)于空間特征的描述,也涉及到對(duì)于屬性特征及其它們之間關(guān)系的描述,所以空間數(shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)的建立是項(xiàng)復(fù)雜的工作;并且由于種種原因,某些數(shù)據(jù)組織或數(shù)據(jù)用戶開發(fā)出來的空間數(shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)很難為地學(xué)界所廣泛接受。但空間數(shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)的建立是空間數(shù)據(jù)標(biāo)準(zhǔn)化的前提和保證,只有建立起規(guī)范的空間數(shù)據(jù)元數(shù)據(jù)才能有效利用空間數(shù)據(jù)。目前,針對(duì)空間數(shù)據(jù)元數(shù)據(jù),已經(jīng)形成了一些區(qū)域性的或部門性的標(biāo)準(zhǔn)* 空間數(shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)的具體介紹見“地理信息系統(tǒng)標(biāo)準(zhǔn)”一章。42空間數(shù)據(jù)元數(shù)據(jù)的應(yīng)用421幫助用戶獲

46、取數(shù)據(jù)通過元數(shù)據(jù),用戶可對(duì)空間數(shù)據(jù)庫進(jìn)行瀏覽、檢索和研究等。一個(gè)完整的地學(xué)數(shù)據(jù)庫除應(yīng)提供空間數(shù)據(jù)和屬性數(shù)據(jù)外,還應(yīng)提供豐富的引導(dǎo)信息,以及由純數(shù)據(jù)得到的分析、綜述和索引等。通過這些信息用戶可以明白一系列問題,如“這些數(shù)據(jù)是什么數(shù)據(jù)?”,“這個(gè)數(shù)據(jù)庫是否有用?”等。422空間數(shù)據(jù)質(zhì)量控制無論是統(tǒng)計(jì)數(shù)據(jù)還是空間數(shù)據(jù)都存在數(shù)據(jù)精確問題,影響空間數(shù)據(jù)精度的原因主要有兩個(gè)方面:一是源數(shù)據(jù)的精度;一是數(shù)據(jù)加工處理工程中精度質(zhì)量的控制情況??臻g數(shù)據(jù)質(zhì)量控制內(nèi)容包括:(1)有準(zhǔn)確定義的數(shù)據(jù)字典,以說明數(shù)據(jù)的組成,各部分的名稱,表征的內(nèi)容等;(2)保證數(shù)據(jù)邏輯科學(xué)地集成,如植被數(shù)據(jù)庫中不同亞類的區(qū)域組合成大類區(qū)

47、,這要求數(shù)據(jù)按一定邏輯關(guān)系有效的組合;(3)有足夠的說明數(shù)據(jù)來源、數(shù)據(jù)的加工處理工程、數(shù)據(jù)解譯的信息。這些要求可通過元數(shù)據(jù)來實(shí)現(xiàn),這類元數(shù)據(jù)的獲取往往由地學(xué)和計(jì)算機(jī)領(lǐng)域的工作者來完成。數(shù)據(jù)邏輯關(guān)系在數(shù)據(jù)中的表達(dá)要由地學(xué)工作者來設(shè)計(jì),空間數(shù)據(jù)庫的編碼要求一定的地學(xué)基礎(chǔ),數(shù)據(jù)質(zhì)量的控制和提高要有數(shù)據(jù)輸入、數(shù)據(jù)查錯(cuò)、數(shù)據(jù)處理專業(yè)背景知識(shí)的工作人員,而數(shù)據(jù)再生產(chǎn)要由計(jì)算機(jī)基礎(chǔ)較好的人員來實(shí)現(xiàn)。所有這方面的元數(shù)據(jù),按一定的組織結(jié)構(gòu)集成到數(shù)據(jù)庫中構(gòu)成數(shù)據(jù)庫的元數(shù)據(jù)信息系統(tǒng)來實(shí)現(xiàn)上述功能。423在數(shù)據(jù)集成中的應(yīng)用數(shù)據(jù)集層次的元數(shù)據(jù)記錄了數(shù)據(jù)格式、空間坐標(biāo)體系、數(shù)據(jù)的表達(dá)形式、數(shù)據(jù)類型等信息;系統(tǒng)層次和應(yīng)用層

48、次的元數(shù)據(jù)則記錄了數(shù)據(jù)使用軟硬件環(huán)境、數(shù)據(jù)使用規(guī)范、數(shù)據(jù)標(biāo)準(zhǔn)等信息。這些信息在數(shù)據(jù)集成的一系列處理中,如數(shù)據(jù)空間匹配、屬性一致化處理、數(shù)據(jù)在各平臺(tái)之間的轉(zhuǎn)換使用等是必要的。這些信息能夠使系統(tǒng)有效地控制系統(tǒng)中的數(shù)據(jù)流。43在地理信息系統(tǒng)中使用元數(shù)據(jù)的原因在地理信息系統(tǒng)中使用元數(shù)據(jù),有利于空間數(shù)據(jù)的管理共享,有利于實(shí)現(xiàn)一些特定功能,對(duì)于地理信息系統(tǒng)軟件的開發(fā),可以提高開發(fā)的效率和質(zhì)量。431性能上的原因1)完整性(Completeness)面向?qū)ο蟮牡乩硇畔⑾到y(tǒng)和空間數(shù)據(jù)庫的目標(biāo)之一,是把事物的有關(guān)數(shù)據(jù)都表示為類的形式,而這些類也包括類自身,即復(fù)雜的“類的類”結(jié)構(gòu)。這就要求有支持類與類之間相互印證

49、和操作的機(jī)制,而元數(shù)據(jù)可以幫助這個(gè)機(jī)制的實(shí)現(xiàn)。2)可擴(kuò)展性(Extensibility)有意地延伸一種計(jì)算機(jī)語言或者數(shù)據(jù)庫特征的語義是很有用的,如把跟蹤或引擎信息的生成結(jié)果添加到操作請(qǐng)求中,通過動(dòng)態(tài)改變?cè)獢?shù)據(jù)信息可以實(shí)現(xiàn)這種功能。3)特殊性(Specialization)繼承機(jī)制是靠動(dòng)態(tài)連接操作請(qǐng)求和操作體來實(shí)現(xiàn)的,語言及數(shù)據(jù)庫以結(jié)構(gòu)化和語義信息的相關(guān)上下文(Context)方式把操作請(qǐng)求傳遞給操作體,而這些信息可以通過元數(shù)據(jù)表達(dá)。4)安全性(Safety)分類完好的語言和數(shù)據(jù)庫都支持動(dòng)態(tài)類型檢測(cè),類的信息表示為元數(shù)據(jù),這樣在系統(tǒng)運(yùn)行時(shí),可以被類檢測(cè)者訪問。432功能上的原因1)查錯(cuò)功能(De

50、bugging)在查錯(cuò)時(shí)使用元數(shù)據(jù)信息,有助于檢測(cè)可運(yùn)行應(yīng)用系統(tǒng)的解釋和修改狀態(tài)。2)瀏覽功能(Browsing)為數(shù)據(jù)的控制類開發(fā)瀏覽器時(shí),為顯示數(shù)據(jù),要求能解釋數(shù)據(jù)的結(jié)構(gòu),而這些信息是以元數(shù)據(jù)來表達(dá)的。3)程序生成(Program Generation)如果允許訪問元數(shù)據(jù),則可以利用關(guān)于結(jié)構(gòu)的信息自動(dòng)生成程序,如數(shù)據(jù)庫查詢的優(yōu)化處理和遠(yuǎn)程過程調(diào)用殘?bào)w(或“樁”,stub)生成。44空間數(shù)據(jù)元數(shù)據(jù)的獲取與管理441空間數(shù)據(jù)元數(shù)據(jù)的獲取空間數(shù)據(jù)元數(shù)據(jù)的獲取是個(gè)較復(fù)雜的過程,相對(duì)于基礎(chǔ)數(shù)據(jù)的形成時(shí)間,它的獲取可分為三個(gè)階段:數(shù)據(jù)收集前、數(shù)據(jù)收集中和數(shù)據(jù)收集后。對(duì)于模型元數(shù)據(jù),這三個(gè)階段分別是模型

51、形成前、模型形成中和模型形成后。第一階段的元數(shù)據(jù)是根據(jù)要建設(shè)的數(shù)據(jù)庫的內(nèi)容而設(shè)計(jì)的元數(shù)據(jù),內(nèi)容包括:普通元數(shù)據(jù)、專指性元數(shù)據(jù);第二階段的元數(shù)據(jù)隨數(shù)據(jù)的形成同步產(chǎn)生;第三階段的元數(shù)據(jù)是在上述數(shù)據(jù)收集到以后,根據(jù)需要產(chǎn)生的,包括數(shù)據(jù)處理過程描述、數(shù)據(jù)利用情況、數(shù)據(jù)質(zhì)量評(píng)估、瀏覽文件的形成、拓?fù)潢P(guān)系、影像數(shù)據(jù)的指標(biāo)體及指標(biāo)、數(shù)據(jù)集大小、數(shù)據(jù)存放路徑等??臻g數(shù)據(jù)元數(shù)據(jù)的獲取方法主要有五種:鍵盤輸入、關(guān)聯(lián)表、測(cè)量法、計(jì)算法和推理法。鍵盤輸入一般工作量大且易出錯(cuò);關(guān)聯(lián)表方法是通過公共項(xiàng)(字段)從已存在的元數(shù)據(jù)或數(shù)據(jù)中獲取有關(guān)的;測(cè)量法容易使用且出錯(cuò)較少,如用全球定位系統(tǒng)測(cè)量數(shù)據(jù)空間點(diǎn)的位置等;計(jì)算方法指由

52、其它元數(shù)據(jù)或數(shù)據(jù)計(jì)算得到的元數(shù)據(jù),如水平位置可由儀器設(shè)置及時(shí)間計(jì)算得到;推理方法指根據(jù)數(shù)據(jù)的特征獲取元數(shù)據(jù)。在元數(shù)據(jù)獲取的不同階段,使用的方法也有差異。在第一階段主要是鍵入方法和關(guān)聯(lián)表方法;第二階段主要采樣測(cè)量方法;第三階段主要方法是計(jì)算和參考方法。442空間數(shù)據(jù)元數(shù)據(jù)的管理空間數(shù)據(jù)元數(shù)據(jù)的理論和方法涉及到數(shù)據(jù)庫和元數(shù)據(jù)兩方面。由于元數(shù)據(jù)的內(nèi)容、形式的差異,元數(shù)據(jù)的管理與數(shù)據(jù)涉及的領(lǐng)域有關(guān),它是通過建立在不同數(shù)據(jù)領(lǐng)域基礎(chǔ)上的元數(shù)據(jù)信息系統(tǒng)實(shí)現(xiàn)的。在元數(shù)據(jù)管理信息系統(tǒng)中,物理層存放數(shù)據(jù)與元數(shù)據(jù),該層由一些軟件通過一定的邏輯關(guān)系與邏輯層關(guān)聯(lián)起來。在概念層中用描述語言及模型定義了許多概念,如實(shí)體名稱、別名等。通過這些概念及其限制特征,經(jīng)過與邏輯層關(guān)聯(lián)可獲取、更新物理層的元數(shù)據(jù)及數(shù)據(jù)。45元數(shù)據(jù)存儲(chǔ)和功能實(shí)現(xiàn)元數(shù)據(jù)系統(tǒng)用于數(shù)據(jù)庫的管理,可以避免數(shù)據(jù)的重復(fù)存儲(chǔ),通過元數(shù)據(jù)建立的邏輯數(shù)據(jù)索引可以高效查詢檢索分布式數(shù)據(jù)庫中任何物理存儲(chǔ)的數(shù)據(jù)。減少數(shù)據(jù)用戶查詢數(shù)據(jù)庫及獲取數(shù)據(jù)的時(shí)間,從而減低數(shù)據(jù)庫的費(fèi)用。數(shù)據(jù)庫的建設(shè)和管理費(fèi)用是數(shù)據(jù)庫整體性能的反映,通過元數(shù)據(jù)可以實(shí)現(xiàn)數(shù)據(jù)庫的設(shè)計(jì)和系統(tǒng)資源的利用方面開支的合理分配,數(shù)據(jù)庫許多功能(如數(shù)據(jù)庫

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論