桂理工地理信息系統(tǒng)原理講義第4章 地理信息系統(tǒng)數(shù)據(jù)采集和數(shù)據(jù)質(zhì)量_第1頁
桂理工地理信息系統(tǒng)原理講義第4章 地理信息系統(tǒng)數(shù)據(jù)采集和數(shù)據(jù)質(zhì)量_第2頁
桂理工地理信息系統(tǒng)原理講義第4章 地理信息系統(tǒng)數(shù)據(jù)采集和數(shù)據(jù)質(zhì)量_第3頁
桂理工地理信息系統(tǒng)原理講義第4章 地理信息系統(tǒng)數(shù)據(jù)采集和數(shù)據(jù)質(zhì)量_第4頁
桂理工地理信息系統(tǒng)原理講義第4章 地理信息系統(tǒng)數(shù)據(jù)采集和數(shù)據(jù)質(zhì)量_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第四章地理信息系統(tǒng)數(shù)據(jù)采集和數(shù)據(jù)質(zhì)量4.1地理信息系統(tǒng)的數(shù)據(jù)質(zhì)量地理信息系統(tǒng)是一個基于計(jì)算機(jī)軟件、硬件和數(shù)據(jù)的集成系統(tǒng),該系統(tǒng)主要通過空間及非空間數(shù)據(jù)的操作,實(shí)現(xiàn)空間檢索、編輯及分析功能。在GIS的幾個主要因素中,數(shù)據(jù)是一個極為重要的因素。在計(jì)算機(jī)軟件、硬件環(huán)境選定之后,GIS中數(shù)據(jù)質(zhì)量的優(yōu)劣,決定著系統(tǒng)分析質(zhì)量以及整個應(yīng)用的成敗。GIS提供的空間數(shù)據(jù)的分析方法被廣泛用于各種領(lǐng)域,用于決策領(lǐng)域的數(shù)據(jù),其質(zhì)量要求應(yīng)該是可知的或可預(yù)測的。4.1.1數(shù)據(jù)質(zhì)量的基本概念一、準(zhǔn)確性(Accuracy)即一個記錄值(測量或觀察值)與它的真實(shí)值之間的接近程度。這個概念是相當(dāng)抽象的,似乎人們已經(jīng)知道存在這樣的事實(shí)。在實(shí)際中,測量的知識可能依賴于測量的類型和比例尺。一般而言,單個的觀察或測量的準(zhǔn)確性的估價僅僅是通過與可獲得的最準(zhǔn)確的測量或公認(rèn)的分類進(jìn)行比較??臻g數(shù)據(jù)的準(zhǔn)確性經(jīng)常是根據(jù)所指的位置、拓?fù)浠蚍强臻g屬性來分類的。它可用誤差(Error)來衡量。二、精度(Precision)即對現(xiàn)象描述的詳細(xì)程度。如對同樣的兩點(diǎn),精度低的數(shù)據(jù)并不一定準(zhǔn)確度也低。精度要求測量能以最好的準(zhǔn)確性來記錄,但是這可能誤導(dǎo)提供了較大的精度,因?yàn)槌鲆粋€測量儀器的已知準(zhǔn)確度的數(shù)字在效率上是冗于的。因此,如果手工操作的數(shù)字化板所返回的坐標(biāo)不可能依賴于比0.1mm還要準(zhǔn)確的一個“真正的”數(shù)值,那么就不存在任何的點(diǎn),在十分之一的地方是以mm表示的。三、空間分辨率(SpatialResolution)分辨率是兩個可測量數(shù)值之間最小的可辯識的差異。那么空間分辨率可以看作記錄變化的最小距離。在一張用肉眼可讀的地圖上,假設(shè)一條線用來記錄一個邊界,分辨率通常由最小線的寬度來確定。地圖上的線很少以小于0.1mm的寬度來畫。在一個圖形掃描儀中最細(xì)的物理分辨率從理論上講是由設(shè)施的像元之間的分離來確定的。在一個激光打印機(jī)上這是一英寸的300分之一,而且在高質(zhì)量的激光掃描儀上,這會細(xì)化十倍。如果沒有放大,最細(xì)的激光掃描儀的線是看不到的,盡管這依賴于背景顏色的對照。因此,在人的視覺分辨率和設(shè)備物理分辨率之間存在著一個差異。一個相似的區(qū)別可以存在于兩個最小距離之間,即當(dāng)人操作者操作數(shù)字化儀時所區(qū)別的最小距離和數(shù)字化儀硬件可以不斷地報告的最小距離。四、比例尺(Scale)比例尺是地圖上一個記錄的距離和它所表現(xiàn)的“真實(shí)世界的”距離之間的一個比例。地圖的比例尺將決定地圖上一條線的寬度所表現(xiàn)的地面的距離。例如,在一個1:10000比例尺的地圖上,一條0.5mm寬度的線對應(yīng)著5m的地面距離。如果這是線的最小的寬度,那么就不可能表示小于5m的現(xiàn)象。五、誤差(Error)定義出一個所記錄的測量和它的事實(shí)之間的準(zhǔn)確性以后,很明顯對于大多數(shù)目的而言,它的數(shù)值是不準(zhǔn)確的。誤差研究包括:位置誤差,即點(diǎn)的位置的誤差、線的位置的誤差和多邊形的位置的誤差;屬性誤差;位置和屬性誤差之間的關(guān)系。六、不確定性(Uncertainty)地理信息系統(tǒng)的不確定性包括空間位置的不確定性、屬性不確定性、時域不確定性、邏輯上的不一致性及數(shù)據(jù)的不完整性??臻g位置的不確定性指GIS中某一被描述物體與其地面上真實(shí)物體位置上的差別;屬性不確定性是指某一物體在GIS中被描述的屬性與其真實(shí)的屬性之差別;時域不確定性是指在描述地理現(xiàn)象時,時間描述上的差錯;邏輯上的不一致性指數(shù)據(jù)結(jié)構(gòu)內(nèi)部的不一致性,尤其是指拓?fù)溥壿嬌系牟灰恢滦?;?shù)據(jù)的不完整性指對于給定的目標(biāo),GIS沒有盡可能完全地表達(dá)該物體。4.1.2空間數(shù)據(jù)質(zhì)量問題的來源從空間數(shù)據(jù)的形式表達(dá)到空間數(shù)據(jù)的生成,從空間數(shù)據(jù)的處理變換到空間數(shù)據(jù)的應(yīng)用,在這兩個過程中都會有數(shù)據(jù)質(zhì)量問題的發(fā)生。下面按照空間數(shù)據(jù)自身存在的規(guī)律性,從幾個方面來闡述空間數(shù)據(jù)質(zhì)量問題的來源。4.1.3空間現(xiàn)象自身存在的不穩(wěn)定性空間數(shù)據(jù)質(zhì)量問題首先來源于空間現(xiàn)象自身存在的不穩(wěn)定性??臻g現(xiàn)象自身存在的不穩(wěn)定性包括空間特征和過程在空間、專題和時間內(nèi)容上的不確定性??臻g現(xiàn)象在空間上的不確定性指其在空間位置分布上的不確定性變化;空間現(xiàn)象在時間上的不確定性表現(xiàn)為其在發(fā)生時間段上的游移性;空間現(xiàn)象在屬性上的不確定性表現(xiàn)為屬性類型劃分的多樣性,非數(shù)值型屬性值表達(dá)的不精確性。因此,空間數(shù)據(jù)存在質(zhì)量問題是不可避免的。4.2空間現(xiàn)象的表達(dá)數(shù)據(jù)采集中的測量方法以及量測精度的選擇等受到人類自身的認(rèn)識和表達(dá)的影響,這對于數(shù)據(jù)的生成會出現(xiàn)誤差。如在地圖投影中,由橢球體到平面的投影轉(zhuǎn)換必然產(chǎn)生誤差;用于獲取各種原始數(shù)據(jù)的各種測量儀器都有一定的設(shè)計(jì)精度,如GPS提供的地理位置數(shù)據(jù)都有用戶要求的一定設(shè)計(jì)精度,因而數(shù)據(jù)誤差的產(chǎn)生不可避免。4.2.1空間數(shù)據(jù)處理中的誤差在空間數(shù)據(jù)處理過程中,容易產(chǎn)生的誤差有以下幾種:投影變換:地圖投影是開口的三維地球橢球面到二維場平面的拓?fù)渥儞Q。在不同投影形式下,地理特征的位置、面積和方向的表現(xiàn)會有差異。地圖數(shù)字化和掃描后的矢量化處理:數(shù)字化過程采點(diǎn)的位置精度、空間分辨率、屬性賦值等都可能出現(xiàn)誤差。數(shù)據(jù)格式轉(zhuǎn)換:在矢量格式和柵格格式之間的數(shù)據(jù)格式轉(zhuǎn)換中,數(shù)據(jù)所表達(dá)的空間特征的位置具有差異性。數(shù)據(jù)抽象:在數(shù)據(jù)發(fā)生比例尺變換時,對數(shù)據(jù)進(jìn)行的聚類、歸并、合并等操作時產(chǎn)生的誤差,如知識性誤差和數(shù)據(jù)所表達(dá)的空間特征位置的變化誤差。建立拓?fù)潢P(guān)系:拓?fù)溥^程中伴隨有數(shù)據(jù)所表達(dá)的空間特征的位置坐標(biāo)的變化。與主控數(shù)據(jù)層的匹配:一個數(shù)據(jù)庫中,常存儲同一地區(qū)的多層數(shù)據(jù)面,為保證各數(shù)據(jù)層之間空間位置的協(xié)調(diào)性,一般建立一個主控數(shù)據(jù)層以控制其它數(shù)據(jù)層的邊界和控制點(diǎn)。在與主控數(shù)據(jù)層匹配的過程中也會存在空間位移,導(dǎo)致誤差。數(shù)據(jù)疊加操作和更新:數(shù)據(jù)在進(jìn)行疊加運(yùn)算以及數(shù)據(jù)更新時,會產(chǎn)生空間位置和屬性值的差異。數(shù)據(jù)集成處理:指在來源不同、類型不同的各種數(shù)據(jù)集的相互操作過程中所產(chǎn)生的誤差。數(shù)據(jù)集成是包括數(shù)據(jù)預(yù)處理、數(shù)據(jù)集之間的相互運(yùn)算、數(shù)據(jù)表達(dá)等過程在內(nèi)的復(fù)雜過程,其中位置誤差、屬性誤差都會出現(xiàn)。數(shù)據(jù)的可視化表達(dá):數(shù)據(jù)在可視化表達(dá)過程中為適應(yīng)視覺效果,需對數(shù)據(jù)的空間特征位置、注記等進(jìn)行調(diào)整,由此產(chǎn)生數(shù)據(jù)表達(dá)上的誤差。數(shù)據(jù)處理過程中誤差的傳遞和擴(kuò)散:在數(shù)據(jù)處理的各個過程中,誤差是累計(jì)和擴(kuò)散的,前一過程的累計(jì)誤差可能成為下一個階段的誤差起源,從而導(dǎo)致新的誤差的產(chǎn)生。4.2.2空間數(shù)據(jù)使用中的誤差在空間數(shù)據(jù)使用的過程中也會導(dǎo)致誤差的出現(xiàn),主要包括兩個方面:一是對數(shù)據(jù)的解釋過程,二是缺少文檔。對于同一種空間數(shù)據(jù)來說,不同用戶對它的內(nèi)容的解釋和理解可能不同,處理這類問題的方法是隨空間數(shù)據(jù)提供各種相關(guān)的文檔說明,如元數(shù)據(jù)。另外,缺少對某一地區(qū)不同來源的空間數(shù)據(jù)的說明,如缺少投影類型、數(shù)據(jù)定義等描述信息,這樣往往導(dǎo)致數(shù)據(jù)用戶對數(shù)據(jù)的隨意性使用而使誤差擴(kuò)散。表1:數(shù)據(jù)的主要誤差來源數(shù)據(jù)處理過程誤差來源數(shù)據(jù)搜集野外測量誤差:儀器誤差、記錄誤差遙感數(shù)據(jù)誤差:輻射和幾何糾正誤差、信息提取誤差地圖數(shù)據(jù)誤差:原始數(shù)據(jù)誤差、坐標(biāo)轉(zhuǎn)換、制圖綜合及印刷數(shù)據(jù)輸入數(shù)字化誤差:儀器誤差、操作誤差不同系統(tǒng)格式轉(zhuǎn)換誤差:柵格-矢量轉(zhuǎn)換、三角網(wǎng)-等值線轉(zhuǎn)換數(shù)據(jù)存儲數(shù)值精度不夠空間精度不夠:每個格網(wǎng)點(diǎn)太大、地圖最小制圖單元太大數(shù)據(jù)處理分類間隔不合理多層數(shù)據(jù)疊合引起的誤差傳播:插值誤差、多源數(shù)據(jù)綜合分析誤差比例尺太小引起的誤差數(shù)據(jù)輸出輸出設(shè)備不精確引起的誤差輸出的媒介不穩(wěn)定造成的誤差數(shù)據(jù)使用對數(shù)據(jù)所包含的信息的誤解對數(shù)據(jù)信息使用不當(dāng)4.2.3常見空間數(shù)據(jù)的誤差分析GIS中的誤差是指GIS中數(shù)據(jù)表示與其現(xiàn)實(shí)世界本身的差別。數(shù)據(jù)誤差的類型可以是隨機(jī)的,也可以是系統(tǒng)的。歸納起來,數(shù)據(jù)的誤差主要有四大類,即幾何誤差、屬性誤差、時間誤差和邏輯誤差。在這幾種誤差中,屬性誤差和時間誤差與普通信息系統(tǒng)中的誤差概念是一致的,幾何誤差是地理信息系統(tǒng)所特有的,而幾何誤差、屬性誤差和時間誤差都會造成邏輯誤差,因此下面主要討論邏輯誤差和幾何誤差。4.2.4誤差的類型1)邏輯誤差數(shù)據(jù)的不完整性是通過上述四類誤差反映出來的。事實(shí)上檢查邏輯誤差,有助于發(fā)現(xiàn)不完整的數(shù)據(jù)和其他三類誤差。對數(shù)據(jù)進(jìn)行質(zhì)量控制或質(zhì)量保證或質(zhì)量評價,一般先從數(shù)據(jù)的邏輯性檢查入手。如圖1所示,其中橋或停車場等與道路是相接的,如果數(shù)據(jù)庫中只有橋或停車場,而沒有與道路相連,則說明道路數(shù)據(jù)被遺漏,使數(shù)據(jù)不完整。圖1:各種邏輯誤差2)幾何誤差由于地圖是以二維平面坐標(biāo)表達(dá)位置,在二維平面上的幾何誤差主要反映在點(diǎn)和線上。點(diǎn)誤差關(guān)于某點(diǎn)的點(diǎn)誤差即為測量位置(x,y)與其真實(shí)位置(x0,y0)的差異。真實(shí)位置的測量方法比測量位置的要更加精確,如在野外使用高精度的GPS方法得到。點(diǎn)誤差可通過計(jì)算坐標(biāo)誤差和距離的方法得到。坐標(biāo)誤差定義為:Δx=x-x0Δy=y-y0為了衡量整個數(shù)據(jù)采集區(qū)域或制圖區(qū)域內(nèi)的點(diǎn)誤差,一般抽樣測算(Δx,Δy)。抽樣點(diǎn)應(yīng)隨機(jī)分布于數(shù)據(jù)采集區(qū)內(nèi),并具有代表性。這樣抽樣點(diǎn)越多,所測的誤差分布就越接近于點(diǎn)誤差的真實(shí)分布。線誤差線在地理信息系統(tǒng)數(shù)據(jù)庫中既可表示線性現(xiàn)象,又可以通過連成的多邊形表示面狀現(xiàn)象。第一類是線上的點(diǎn)在真實(shí)世界中是可以找到的,如道路、河流、行政界線等,這類的線性特征的誤差主要產(chǎn)生于測量和對數(shù)據(jù)的后處理;第二類是現(xiàn)實(shí)世界中找不到的,如按數(shù)學(xué)投影定義的經(jīng)緯線、按高程繪制的等高線,或者是氣候區(qū)劃線和土壤類型界限等,這類線性特征的線誤差及在確定線的界限時的誤差,被稱為解譯誤差。解譯誤差與屬性誤差直接相關(guān),若沒有屬性誤差,則可以認(rèn)為那些類型界線是準(zhǔn)確的,因而解譯誤差為零。另外,線分為直線、折線、曲線與直線混合的線(圖2)。GIS數(shù)據(jù)庫中用兩種方法表達(dá)曲線、折線,圖3對這兩類誤差作了對照。圖2:各種線(直線、折線、曲線)圖3:折線和曲線的誤差線誤差分布可以用Epsilon帶模型來描述,它由沿著一條線以及兩側(cè)定寬的帶構(gòu)成,真實(shí)的線以某一概率落于Epsilon帶內(nèi)。Epsilon帶是等寬的(類似于后面講述的緩沖區(qū),不過其意義不同),在此基礎(chǔ)上,誤差帶模型被提出,與Epsilon帶模型相比,它在中間最窄而在兩端較寬?;谡`差帶模型,可以把直線與折線誤差分布的特點(diǎn)分別看作是“骨頭型”或者“車鏈型”的誤差分布帶模式(圖4)。圖4:折線誤差的分布對于曲線的誤差分布或許應(yīng)當(dāng)考慮“串腸型模式”(圖5)。圖5:曲線的誤差分布4.2.5地圖數(shù)據(jù)的質(zhì)量問題地圖數(shù)據(jù)是現(xiàn)有地圖經(jīng)過數(shù)字化或掃描處理后生成的數(shù)據(jù)。在地圖數(shù)據(jù)質(zhì)量問題中,不僅含有地圖固有的誤差,還包括圖紙變形、圖形數(shù)字化等誤差。1)地圖固有誤差:是指用于數(shù)字化的地圖本身所帶有的誤差,包括控制點(diǎn)誤差、投影誤差等。由于這些誤差間的關(guān)系很難確定,所以很難對其綜合誤差作出準(zhǔn)確評價。如果假定綜合誤差與各類誤差間存在線性關(guān)系,即可用誤差傳播定律來計(jì)算綜合誤差。2)材料變形產(chǎn)生的誤差:這類誤差是由于圖紙的大小受濕度和溫度變化的影響而產(chǎn)生的。溫度不變的情況下,若濕度由0%增至25%,則紙的尺寸可能改變1.6%;紙的膨脹率和收縮率并不相同,即使?jié)穸扔只謴?fù)到原來的大小,圖紙也不能恢復(fù)原有的尺寸,一張6英寸的圖紙因濕度變化而產(chǎn)生的誤差可能高達(dá)0.576英寸。在印刷過程中,紙張先隨溫度的升高而變長變寬,又由于冷卻而產(chǎn)生收縮。3)圖象數(shù)字化誤差:數(shù)字化方式主要有跟蹤數(shù)字化和掃描數(shù)字化兩種。跟蹤數(shù)字化一般有點(diǎn)方式和流方式兩種工作方式,前者在實(shí)際工作中使用較多,后者進(jìn)行數(shù)字化所產(chǎn)生的誤差要比前者大得多。4.2.6遙感數(shù)據(jù)的質(zhì)量問題遙感數(shù)據(jù)的質(zhì)量問題,一部分來自遙感儀器的觀測過程,一部分來自遙感圖象處理和解譯過程。遙感觀測過程本身存在著精確度和準(zhǔn)確度的限制,這一過程產(chǎn)生的誤差主要表現(xiàn)為空間分辨率、幾何畸變和輻射誤差,這些誤差將影響遙感數(shù)據(jù)的位置和屬性精度。遙感圖像處理和解譯過程,主要產(chǎn)生空間位置和屬性方面的誤差。這是由圖像處理中的影像或圖像校正和匹配以及遙感解譯判讀和分類引入的,其中包括混合像元的解譯判讀所帶來的屬性誤差。4.3空間數(shù)據(jù)質(zhì)量控制數(shù)據(jù)質(zhì)量控制是個復(fù)雜的過程,要控制數(shù)據(jù)質(zhì)量應(yīng)從數(shù)據(jù)質(zhì)量產(chǎn)生和擴(kuò)散的所有過程和環(huán)節(jié)入手,分別用一定的方法減少誤差??臻g數(shù)據(jù)質(zhì)量控制常見的方法有:4.3.1傳統(tǒng)的手工方法質(zhì)量控制的人工方法主要是將數(shù)字化數(shù)據(jù)與數(shù)據(jù)源進(jìn)行比較,圖形部分的檢查包括目視方法、繪制到透明圖上與原圖疊加比較,屬性部分的檢查采用與原屬性逐個對比或其他比較方法。4.3.2元數(shù)據(jù)方法數(shù)據(jù)集的元數(shù)據(jù)中包含了大量的有關(guān)數(shù)據(jù)質(zhì)量的信息,通過它可以檢查數(shù)據(jù)質(zhì)量,同時元數(shù)據(jù)也記錄了數(shù)據(jù)處理過程中質(zhì)量的變化,通過跟蹤元數(shù)據(jù)可以了解數(shù)據(jù)質(zhì)量的狀況和變化。4.3.3地理相關(guān)法用空間數(shù)據(jù)的地理特征要素自身的相關(guān)性來分析數(shù)據(jù)的質(zhì)量。如從地表自然特征的空間分布著手分析,山區(qū)河流應(yīng)位于微地形的最低點(diǎn),因此,疊加河流和等高線兩層數(shù)據(jù)時,如河流的位置不在等高線的外凸連線上,則說明兩層數(shù)據(jù)中必有一層數(shù)據(jù)有質(zhì)量問題,如不能確定哪層數(shù)據(jù)有問題時,可以通過將它們分別與其它質(zhì)量可靠的數(shù)據(jù)層疊加來進(jìn)一步分析。因此,可以建立一個有關(guān)地理特征要素相關(guān)關(guān)系的知識庫,以備各空間數(shù)據(jù)層之間地理特征要素的相關(guān)分析之用。4.4空間數(shù)據(jù)的元數(shù)據(jù)Metadata可以譯成元數(shù)據(jù),是描述數(shù)據(jù)的數(shù)據(jù)。在地理空間數(shù)據(jù)中,元數(shù)據(jù)是說明數(shù)據(jù)內(nèi)容、質(zhì)量、狀況和其他有關(guān)特征的背景信息。元數(shù)據(jù)并不是一個新的概念。實(shí)際上傳統(tǒng)的圖書館卡片、出版圖書的版權(quán)說明、磁盤的標(biāo)簽等都是元數(shù)據(jù)。紙質(zhì)地圖的元數(shù)據(jù)主要表現(xiàn)為地圖類型、地圖圖例,包括圖名、空間參照系和圖廓坐標(biāo)、地圖內(nèi)容說明、比例尺和精度、編制出版單位和日期或更新日期、銷售信息等。在這種形式下,元數(shù)據(jù)是可讀的,生產(chǎn)者和用戶之間容易交流,用戶通過它可以非常容易地確定該書或地圖是否能夠滿足其應(yīng)用的需要。隨著計(jì)算機(jī)技術(shù)和GIS技術(shù)發(fā)展,特別是網(wǎng)絡(luò)通信技術(shù)的發(fā)展,空間數(shù)據(jù)共享日益普遍。管理和訪問大型數(shù)據(jù)集的復(fù)雜性正成為數(shù)據(jù)生產(chǎn)者和用戶面臨的突出問題。數(shù)據(jù)生產(chǎn)者需要有效的數(shù)據(jù)管理和維護(hù)辦法;用戶需要找到更快、更加全面和有效的方法,以便發(fā)現(xiàn)、訪問、獲取和使用現(xiàn)勢性強(qiáng)、精度高、易管理和易訪問的地理空間數(shù)據(jù)。在這種情況下,空間數(shù)據(jù)的內(nèi)容、質(zhì)量、狀況等元數(shù)據(jù)信息變得更加重要,成為信息資源有效管理和應(yīng)用的重要手段。地理信息元數(shù)據(jù)標(biāo)準(zhǔn)和操作工具已經(jīng)成為國家空間數(shù)據(jù)基礎(chǔ)設(shè)施的一個重要組成部分。在地理信息系統(tǒng)應(yīng)用中,元數(shù)據(jù)的主要作用可以歸納為如下幾個方面:1)幫助數(shù)據(jù)生產(chǎn)單位有效地管理和維護(hù)空間數(shù)據(jù)、建立數(shù)據(jù)文檔,并保證即使其主要工作人員離退時,也不會失去對數(shù)據(jù)情況的了解;2)提供有關(guān)數(shù)據(jù)生產(chǎn)單位數(shù)據(jù)存儲、數(shù)據(jù)分類、數(shù)據(jù)內(nèi)容、數(shù)據(jù)質(zhì)量、數(shù)據(jù)交換網(wǎng)絡(luò)及數(shù)據(jù)銷售等方面的信息,便于用戶查詢檢索地理空間數(shù)據(jù);3)幫助用戶了解數(shù)據(jù),以便就數(shù)據(jù)是否能滿足其需求做出正確的判斷;4)提供有關(guān)信息,以便用戶處理和轉(zhuǎn)換有用的數(shù)據(jù)。可見,元數(shù)據(jù)是使數(shù)據(jù)充分發(fā)揮作用的重要條件之一,它可以用于許多方面,包括數(shù)據(jù)文檔建立、數(shù)據(jù)發(fā)布、數(shù)據(jù)瀏覽、數(shù)據(jù)轉(zhuǎn)換等。元數(shù)據(jù)對于促進(jìn)數(shù)據(jù)的管理、使用和共享均有重要的作用。4.4.1元數(shù)據(jù)的概念及類型一、元數(shù)據(jù)的概念元數(shù)據(jù)是關(guān)于數(shù)據(jù)的描述性數(shù)據(jù)信息,它應(yīng)盡可能多地反映數(shù)據(jù)集自身的特征規(guī)律,以便于用戶對數(shù)據(jù)集的準(zhǔn)確、高效與充分的開發(fā)與利用,不同領(lǐng)域的數(shù)據(jù)庫,其元數(shù)據(jù)的內(nèi)容會有很大差異。通過元數(shù)據(jù)可以檢索、訪問數(shù)據(jù)庫,可以有效利用計(jì)算機(jī)的系統(tǒng)資源,可以對數(shù)據(jù)進(jìn)行加工處理和二次開發(fā)等。到目前為止,科學(xué)界關(guān)于元數(shù)據(jù)認(rèn)識的共同點(diǎn)是:元數(shù)據(jù)的目的就是促進(jìn)數(shù)據(jù)集的高效利用,并為計(jì)算機(jī)輔助軟件工程(CASE)服務(wù)。元數(shù)據(jù)的內(nèi)容包括:1)對數(shù)據(jù)集的描述;對數(shù)據(jù)集中各數(shù)據(jù)項(xiàng)、數(shù)據(jù)來源、數(shù)據(jù)所有者及數(shù)據(jù)序代(數(shù)據(jù)生產(chǎn)歷史)等的說明;2)對數(shù)據(jù)質(zhì)量的描述,如數(shù)據(jù)精度、數(shù)據(jù)的邏輯一致性、數(shù)據(jù)完整性、分辨率、元數(shù)據(jù)的比例尺等;3)對數(shù)據(jù)處理信息的說明,如量綱的轉(zhuǎn)換等;4)對數(shù)據(jù)轉(zhuǎn)換方法的描述;5)對數(shù)據(jù)庫的更新、集成等的說明。二、元數(shù)據(jù)的類型元數(shù)據(jù)的分類研究的目的在于充分了解和更好地使用元數(shù)據(jù)。分類的原則不同,元數(shù)據(jù)的分類體系和內(nèi)容將會有很大的差異。1)根據(jù)元數(shù)據(jù)的內(nèi)容分類由于不同性質(zhì)、不同領(lǐng)域的數(shù)據(jù)所需要的元數(shù)據(jù)內(nèi)容有差異,而且為不同應(yīng)用目的而建設(shè)的數(shù)據(jù)庫的元數(shù)據(jù)內(nèi)容會有很大的差異,所以將元數(shù)據(jù)化分為三種類型:科研型元數(shù)據(jù):其主要目標(biāo)是幫助用戶獲取各種來源的數(shù)據(jù)及其相關(guān)信息,它不僅包括如數(shù)據(jù)源名稱、作者、主體內(nèi)容等傳統(tǒng)的、圖書管理式的元數(shù)據(jù),還包含數(shù)據(jù)拓?fù)潢P(guān)系等。這類元數(shù)據(jù)的任務(wù)是幫助科研工作者高效獲取所需數(shù)據(jù)。評估型元數(shù)據(jù):主要服務(wù)于數(shù)據(jù)利用的評價,內(nèi)容包括數(shù)據(jù)最初收集情況、收集數(shù)據(jù)所用的儀器、數(shù)據(jù)獲取的方法和依據(jù)、數(shù)據(jù)處理過程和算法、數(shù)據(jù)質(zhì)量控制、采樣方法、數(shù)據(jù)精度、數(shù)據(jù)的可信度、數(shù)據(jù)潛在應(yīng)用領(lǐng)域等。模型元數(shù)據(jù):用于描述數(shù)據(jù)模型的元數(shù)據(jù)與描述數(shù)據(jù)的元數(shù)據(jù)在結(jié)構(gòu)上大致相同,其內(nèi)容包括模型名稱、模型類型、建模過程、模型參數(shù)、邊界條件、作者、引用模型描述、建模使用軟件、模型輸出等。2)根據(jù)元數(shù)據(jù)描述對象分類數(shù)據(jù)層元數(shù)據(jù):指描述數(shù)據(jù)集中每個數(shù)據(jù)的元數(shù)據(jù),內(nèi)容包括日期郵戳、位置戳、量綱、注釋、誤差標(biāo)識、縮略標(biāo)識、存在問題標(biāo)識、數(shù)據(jù)處理過程等。屬性元數(shù)據(jù):是關(guān)于屬性數(shù)據(jù)的元數(shù)據(jù),內(nèi)容包括為表達(dá)數(shù)據(jù)及其含義所建的數(shù)據(jù)字典、數(shù)據(jù)處理規(guī)則(協(xié)議),如采樣說明、數(shù)據(jù)傳輸線路及代數(shù)編碼等。實(shí)體元數(shù)據(jù):是描述整個數(shù)據(jù)集的元數(shù)據(jù),內(nèi)容包括數(shù)據(jù)集區(qū)域采樣原則、數(shù)據(jù)庫的有效期、數(shù)據(jù)時間跨度等。3)根據(jù)元數(shù)據(jù)在系統(tǒng)中的作用分類系統(tǒng)級別元數(shù)據(jù):指用于實(shí)現(xiàn)文件系統(tǒng)特征或管理文件系統(tǒng)中數(shù)據(jù)的信息,如訪問數(shù)據(jù)的時間、數(shù)據(jù)的大小、在存儲級別中的當(dāng)前位置、如何存儲數(shù)據(jù)塊以保證服務(wù)控制質(zhì)量等。應(yīng)用層元數(shù)據(jù):指有助于用戶查找、評估、訪問和管理數(shù)據(jù)等與數(shù)據(jù)用戶有關(guān)的信息,如文本文件內(nèi)容的摘要信息、圖形快照、描述與其它數(shù)據(jù)文件相關(guān)關(guān)系的信息。它往往用于高層次的數(shù)據(jù)管理,用戶通過它可以快速獲取合適的數(shù)據(jù)。4)根據(jù)元數(shù)據(jù)的作用分類說明元數(shù)據(jù):是為用戶使用數(shù)據(jù)服務(wù)的元數(shù)據(jù)。它一般用自然語言表達(dá),如源數(shù)據(jù)覆蓋的空間范圍、源數(shù)據(jù)圖的投影方式及比例尺的大小、數(shù)據(jù)集說明文件等,這類元數(shù)據(jù)多為描述性信息,側(cè)重于數(shù)據(jù)庫的說明。控制元數(shù)據(jù):是用于計(jì)算機(jī)操作流程控制的元數(shù)據(jù),這類元數(shù)據(jù)由一定的關(guān)鍵詞和特定的句法來實(shí)現(xiàn)。其內(nèi)容包括數(shù)據(jù)存儲和檢索文件、檢索中與目標(biāo)匹配方法、目標(biāo)的檢索和顯示、分析查詢結(jié)果排列顯示、根據(jù)用戶要求修改數(shù)據(jù)庫中原有的內(nèi)部順序、數(shù)據(jù)轉(zhuǎn)換方法、空間數(shù)據(jù)和屬性數(shù)據(jù)的集成、根據(jù)索引項(xiàng)把數(shù)據(jù)繪制成圖、數(shù)據(jù)模型的建設(shè)和利用等。這類元數(shù)據(jù)主要是與數(shù)據(jù)庫操作有關(guān)的方法。4.4.2空間數(shù)據(jù)元數(shù)據(jù)的標(biāo)準(zhǔn)同物理、化學(xué)等學(xué)科使用的數(shù)據(jù)結(jié)構(gòu)類型相比,空間數(shù)據(jù)是一種結(jié)構(gòu)比較復(fù)雜的數(shù)據(jù)類型。它涉及到對于空間特征的描述,也涉及到對于屬性特征及其它們之間關(guān)系的描述,所以空間數(shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)的建立是項(xiàng)復(fù)雜的工作;并且由于種種原因,某些數(shù)據(jù)組織或數(shù)據(jù)用戶開發(fā)出來的空間數(shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)很難為地學(xué)界所廣泛接受。但空間數(shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)的建立是空間數(shù)據(jù)標(biāo)準(zhǔn)化的前提和保證,只有建立起規(guī)范的空間數(shù)據(jù)元數(shù)據(jù)才能有效利用空間數(shù)據(jù)。目前,針對空間數(shù)據(jù)元數(shù)據(jù),已經(jīng)形成了一些區(qū)域性的或部門性的標(biāo)準(zhǔn)。4.5空間數(shù)據(jù)元數(shù)據(jù)的應(yīng)用4.5.1幫助用戶獲取數(shù)據(jù)通過元數(shù)據(jù),用戶可對空間數(shù)據(jù)庫進(jìn)行瀏覽、檢索和研究等。一個完整的地學(xué)數(shù)據(jù)庫除應(yīng)提供空間數(shù)據(jù)和屬性數(shù)據(jù)外,還應(yīng)提供豐富的引導(dǎo)信息,以及由純數(shù)據(jù)得到的分析、綜述和索引等。通過這些信息用戶可以明白一系列問題,如“這些數(shù)據(jù)是什么數(shù)據(jù)?”,“這個數(shù)據(jù)庫是否有用?”等。4.5.2空間數(shù)據(jù)質(zhì)量控制無論是統(tǒng)計(jì)數(shù)據(jù)還是空間數(shù)據(jù)都存在數(shù)據(jù)精確問題,影響空間數(shù)據(jù)精度的原因主要有兩個方面:一是源數(shù)據(jù)的精度;一是數(shù)據(jù)加工處理工程中精度質(zhì)量的控制情況。空間數(shù)據(jù)質(zhì)量控制內(nèi)容包括:(1)有準(zhǔn)確定義的數(shù)據(jù)字典,以說明數(shù)據(jù)的組成,各部分的名稱,表征的內(nèi)容等;(2)保證數(shù)據(jù)邏輯科學(xué)地集成,如植被數(shù)據(jù)庫中不同亞類的區(qū)域組合成大類區(qū),這要求數(shù)據(jù)按一定邏輯關(guān)系有效的組合;(3)有足夠的說明數(shù)據(jù)來源、數(shù)據(jù)的加工處理工程、數(shù)據(jù)解譯的信息。這些要求可通過元數(shù)據(jù)來實(shí)現(xiàn),這類元數(shù)據(jù)的獲取往往由地學(xué)和計(jì)算機(jī)領(lǐng)域的工作者來完成。數(shù)據(jù)邏輯關(guān)系在數(shù)據(jù)中的表達(dá)要由地學(xué)工作者來設(shè)計(jì),空間數(shù)據(jù)庫的編碼要求一定的地學(xué)基礎(chǔ),數(shù)據(jù)質(zhì)量的控制和提高要有數(shù)據(jù)輸入、數(shù)據(jù)查錯、數(shù)據(jù)處理專業(yè)背景知識的工作人員,而數(shù)據(jù)再生產(chǎn)要由計(jì)算機(jī)基礎(chǔ)較好的人員來實(shí)現(xiàn)。所有這方面的元數(shù)據(jù),按一定的組織結(jié)構(gòu)集成到數(shù)據(jù)庫中構(gòu)成數(shù)據(jù)庫的元數(shù)據(jù)信息系統(tǒng)來實(shí)現(xiàn)上述功能。4.5.3在數(shù)據(jù)集成中的應(yīng)用數(shù)據(jù)集層次的元數(shù)據(jù)記錄了數(shù)據(jù)格式、空間坐標(biāo)體系、數(shù)據(jù)的表達(dá)形式、數(shù)據(jù)類型等信息;系統(tǒng)層次和應(yīng)用層次的元數(shù)據(jù)則記錄了數(shù)據(jù)使用軟硬件環(huán)境、數(shù)據(jù)使用規(guī)范、數(shù)據(jù)標(biāo)準(zhǔn)等信息。這些信息在數(shù)據(jù)集成的一系列處理中,如數(shù)據(jù)空間匹配、屬性一致化處理、數(shù)據(jù)在各平臺之間的轉(zhuǎn)換使用等是必要的。這些信息能夠使系統(tǒng)有效地控制系統(tǒng)中的數(shù)據(jù)流。4.5.4在地理信息系統(tǒng)中使用元數(shù)據(jù)的原因在地理信息系統(tǒng)中使用元數(shù)據(jù),有利于空間數(shù)據(jù)的管理共享,有利于實(shí)現(xiàn)一些特定功能,對于地理信息系統(tǒng)軟件的開發(fā),可以提高開發(fā)的效率和質(zhì)量。4.5.5性能上的原因1)完整性(Completeness)面向?qū)ο蟮牡乩硇畔⑾到y(tǒng)和空間數(shù)據(jù)庫的目標(biāo)之一,是把事物的有關(guān)數(shù)據(jù)都表示為類的形式,而這些類也包括類自身,即復(fù)雜的“類的類”結(jié)構(gòu)。這就要求有支持類與類之間相互印證和操作的機(jī)制,而元數(shù)據(jù)可以幫助這個機(jī)制的實(shí)現(xiàn)。2)可擴(kuò)展性(Extensibility)有意地延伸一種計(jì)算機(jī)語言或者數(shù)據(jù)庫特征的語義是很有用的,如把跟蹤或引擎信息的生成結(jié)果添加到操作請求中,通過動態(tài)改變元數(shù)據(jù)信息可以實(shí)現(xiàn)這種功能。3)特殊性(Specialization)繼承機(jī)制是靠動態(tài)連接操作請求和操作體來實(shí)現(xiàn)的,語言及數(shù)據(jù)庫以結(jié)構(gòu)化和語義信息的相關(guān)上下文(Context)方式把操作請求傳遞給操作體,而這些信息可以通過元數(shù)據(jù)表達(dá)。4)安全性(Safety)分類完好的語言和數(shù)據(jù)庫都支持動態(tài)類型檢測,類的信息表示為元數(shù)據(jù),這樣在系統(tǒng)運(yùn)行時,可以被類檢測者訪問。4.5.6功能上的原因1)查錯功能(Debugging)在查錯時使用元數(shù)據(jù)信息,有助于檢測可運(yùn)行應(yīng)用系統(tǒng)的解釋和修改狀態(tài)。2)瀏覽功能(Browsing)為數(shù)據(jù)的控制類開發(fā)瀏覽器時,為顯示數(shù)據(jù),要求能解釋數(shù)據(jù)的結(jié)構(gòu),而這些信息是以元數(shù)據(jù)來表達(dá)的。3)程序生成(ProgramGeneration)如果允許訪問元數(shù)據(jù),則可以利用關(guān)于結(jié)構(gòu)的信息自動生成程序,如數(shù)據(jù)庫查詢的優(yōu)化處理和遠(yuǎn)程過程調(diào)用殘體(或“樁”,stub)生成。4.5.7空間數(shù)據(jù)元數(shù)據(jù)的獲取與管理一、空間數(shù)據(jù)元數(shù)據(jù)的獲取空間數(shù)據(jù)元數(shù)據(jù)的獲取是個較復(fù)雜的過程,相對于基礎(chǔ)數(shù)據(jù)的形成時間,它的獲取可分為三個階段:數(shù)據(jù)收集前、數(shù)據(jù)收集中和數(shù)據(jù)收集后。對于模型元數(shù)據(jù),這三個階段分別是模型形成前、模型形成中和模型形成后。第一階段的元數(shù)據(jù)是根據(jù)要建設(shè)的數(shù)據(jù)庫的內(nèi)容而設(shè)計(jì)的元數(shù)據(jù),內(nèi)容包括:普通元數(shù)據(jù)、專指性元數(shù)據(jù);第二階段的元數(shù)據(jù)隨數(shù)據(jù)的形成同步產(chǎn)生;第三階段的元數(shù)據(jù)是在上述數(shù)據(jù)收集到以后,根據(jù)需要產(chǎn)生的,包括數(shù)據(jù)處理過程描述、數(shù)據(jù)利用情況、數(shù)據(jù)質(zhì)量評估、瀏覽文件的形成、拓?fù)潢P(guān)系、影像數(shù)據(jù)的指標(biāo)體及指標(biāo)、數(shù)據(jù)集大小、數(shù)據(jù)存放路徑等。空間數(shù)據(jù)元數(shù)據(jù)的獲取方法主要有五種:鍵盤輸入、關(guān)聯(lián)表、測量法、計(jì)算法和推理法。鍵盤輸入一般工作量大且易出錯;關(guān)聯(lián)表方法是通過公共項(xiàng)(字段)從已存在的元數(shù)據(jù)或數(shù)據(jù)中獲取有關(guān)的;測量法容易使用且出錯較少,如用全球定位系統(tǒng)測量數(shù)據(jù)空間點(diǎn)的位置等;計(jì)算方法指由其它元數(shù)據(jù)或數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論