基于本體的地理信息共享與互操作_第1頁
基于本體的地理信息共享與互操作_第2頁
基于本體的地理信息共享與互操作_第3頁
基于本體的地理信息共享與互操作_第4頁
基于本體的地理信息共享與互操作_第5頁
已閱讀5頁,還剩90頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、 基于本體的地理信息共享基于本體的地理信息共享與互操作與互操作地理信息共享與互操作地理信息共享與互操作主要內(nèi)容主要內(nèi)容研究背景本體的概念、分類、描述語言、構(gòu)造和推理等的介紹地理本體的概念、概念分類以及地理本體的建立和研究現(xiàn)狀等的介紹 1 研究背景 隨著Internet/Intranet的發(fā)展和web的廣泛使用,特別是“數(shù)字地球”研究的興起和“國家空間數(shù)據(jù)基礎設施”方案的提出,促進了GIS向著網(wǎng)絡化、標準化、全球化和大眾化方向迅速發(fā)展。但在GIS發(fā)展過程中,由于不同部門行業(yè)在信息的組織和利用基本上是在相對孤立的系統(tǒng)內(nèi)進行的,空間數(shù)據(jù)的采集、數(shù)字化均存儲在不同的數(shù)據(jù)庫中,不同的單位部門按照各自需求

2、采用不同的數(shù)據(jù)建模方法,選用不同的GIS軟件,從而造成了不同系統(tǒng)地理數(shù)據(jù)組織之間有很大差異,缺少通用的構(gòu)建方法,使得地理信息和數(shù)據(jù)的共享與交互變得困難。1.1 空間信息的異構(gòu)性 數(shù)據(jù)內(nèi)容和數(shù)據(jù)源 空間數(shù)據(jù)模型表達機制 空間數(shù)據(jù)格式 空間參考信息 空間數(shù)據(jù)存儲方式 支撐軟件平臺1.2 空間數(shù)據(jù)庫設計中產(chǎn)生的異構(gòu)1.3 空間信息集成共享發(fā)展的階段 (1)文件管理模式階段 空間信息互操作與數(shù)據(jù)共享主要通過數(shù)據(jù)格式轉(zhuǎn)換來實現(xiàn),存在的問題是數(shù)據(jù)格式相互封閉、空間數(shù)據(jù)在轉(zhuǎn)換過程中會有信息丟失、效率很低下等,因此,無法解決空間信息共享問題。 (2)空間數(shù)據(jù)庫管理模式階段 通過把圖形與屬性數(shù)據(jù)同時存放于對象關

3、系數(shù)據(jù)庫中或通過空間數(shù)據(jù)庫引擎(SDE)來存入關系型數(shù)據(jù)庫實現(xiàn)數(shù)據(jù)與信息的共享,由于不同的GIS軟件平臺所采用的數(shù)據(jù)庫存儲格式與空間索引方式仍然不相同,因此,也不能從根本上解決空間數(shù)據(jù)共享集成問題。 (3)元數(shù)據(jù)信息交互模式階段 通過抽取空間數(shù)據(jù)的元數(shù)據(jù)信息,提供對空間數(shù)據(jù)的名稱、來源、組織結(jié)構(gòu)、適用范圍等特征描述,利用空間數(shù)據(jù)元數(shù)據(jù)建立的空間信息的數(shù)據(jù)目錄和數(shù)據(jù)交換中心實現(xiàn)對數(shù)據(jù)的發(fā)現(xiàn)、獲取、理解,從而實現(xiàn)空間信息的共享集成利用,但共享僅限于語法層次,無法滿足基于語義的共享集成。 (4) Ontology驅(qū)動的空間信息共享與互操作階段 一代Web ( Semantic Web )出現(xiàn)了,它試

4、圖在語義與知識的層次上實現(xiàn)互聯(lián)網(wǎng)上資源的全面連通交互與共享,特別是Web信息或知識等資源語義級的精確表達、共享與互操作。研發(fā)支持語義環(huán)境下空間信息與知識互操作的關鍵機制與技術(shù)已成為必然。 現(xiàn)在,在語義層次上的知識與信息互操作核心技術(shù)方面,人工智能(AI )與知識工程(KE)領域的Ontology理論與技術(shù)己經(jīng)成為國內(nèi)外相關研究的主流,許多研究者或機構(gòu)已經(jīng)開始了基于Ontology的信息與知識系統(tǒng)集成方法(Ontology Based Information System Integration )研究,并己經(jīng)取得階段性成果;Web環(huán)境下語義層次的空間信息或知識互操作與共享研究也己經(jīng)開始,并且也

5、引入了基于Ontology的GIS集成方法研究。研究實踐表明,Ontology技術(shù)將對語義化 Web環(huán)境下的空間信息集成共享起到關鍵性作用。1.4 空間數(shù)據(jù)共享實現(xiàn)面臨的問題一、傳統(tǒng)的地理信息語義描述的不足 GIS主要側(cè)重表達地理特征的幾何成分,語義關系不被重視,對現(xiàn)實世界空間幾何目標的抽象忽視了地理現(xiàn)象的本質(zhì)特性及現(xiàn)象之間的內(nèi)在聯(lián)系,減少了信息容量; 注重空間位置描述的矢量或柵格數(shù)據(jù)組織模型,喪失了以分類屬性和相互關系為基礎的結(jié)構(gòu)化實體所提供的豐富的分析能力。 基于專題地理分層的空間數(shù)據(jù)表達思想和單一圖層內(nèi)以矢量或柵格數(shù)據(jù)結(jié)構(gòu)基本單元作為地理實體或現(xiàn)象基本建模單元的表達方式,對于復雜地理實體

6、或現(xiàn)象的描述及地理過程分析存在嚴重不足。 二、對空間知識理解差異導致語義異構(gòu) 由于人們對各自領域內(nèi)空間信息認知的不同,導致對同一地理現(xiàn)象觀察描述會側(cè)重于對象不同的切面,從而產(chǎn)生觀點上的差異,形成語義異構(gòu)。 由于現(xiàn)有的空間數(shù)據(jù)模型多是從計算機表達的角度出發(fā),而不是面向真實地理環(huán)境,所以缺少對領域內(nèi)空間地理實體或現(xiàn)象的顯式定義和基礎關系描述,不能在語義層次上實現(xiàn)數(shù)據(jù)的共享。1.5 空間信息的語義異構(gòu)問題 命名異構(gòu):由于命名沖突造成的異構(gòu)。 類型異構(gòu):由于采用不同的數(shù)據(jù)類型造成的異構(gòu)。 概念異構(gòu):由于表示不同的領域概念造成的異構(gòu)。 1.5.1 以森林防火系統(tǒng)為例 森林防火系統(tǒng)需要建立一個合成服務進行

7、火災事故的管理要求當火災發(fā)生后能給出煙霧擴散情況的信息。假定已經(jīng)建立了一個能夠?qū)崿F(xiàn)該功能的專業(yè)服務CalucatleGasDispersoinsevriee。該服務需要的輸入是風速、風向、氣體擴散的位置以及擴散速率方面的信息,服務的輸出是指示氣體擴散情況的多邊形。以風向信息為例進行分析。在UDDI注冊中心以天氣信息作為關鍵字搜尋相關服務,能夠找到兩個服務:Globalweahtersevriee和Alprortwehateresvrcie?,F(xiàn)在必須判斷這兩個服務的輸出是否真正的能夠從結(jié)構(gòu)以及語義上滿足CaleulateGasDispersionsevriee輸入的需求。 經(jīng)分析,可能會出現(xiàn)以下

8、幾種類型的語義沖突問題。當Airportweathersevriee和Globalweathersevriee都能提供 風向信息,并都表示同一個領域概念,但它們采用的命名不同時,則會產(chǎn)生命名異構(gòu)的問題。 當Airportweathersevriee和Globalweathersevriee提供風向信息時, Airportweathersevriee采用復雜類型“Direction”,而 Globalweathersevriee采用字符串類型“String”,均表示同一個領域概念,但由于采用不同的數(shù)據(jù)類型,則會產(chǎn)生類型異構(gòu)的問題。當Airportweathersevriee和Globalweat

9、hersevriee采用相同的命名,采用的數(shù)據(jù)類型也相同,但前一個服務表示風吹來的方向,后一個服務表示風吹走的方向,由于表示不同的領域概念,則會出現(xiàn)概念異構(gòu)的問題。 為了解決以上的語義沖突問題,實現(xiàn)空間數(shù)據(jù)的共享和互操作,提出了基于本體的地理信息的共享和互操作技術(shù),通過運用本體所具有的良好概念層次結(jié)構(gòu)和對邏輯推理的支持能力,以期實現(xiàn)空間數(shù)據(jù)的共享和各種地理服務的互操作。2 .1 本體的概念 哲學中的定義:本體是對世界上客觀存在物的系統(tǒng)地描述,關心的是客觀現(xiàn)實的抽象本質(zhì)。 計算機領域:本體是概念化的顯式說明或表示。 知識工程鄰域:本體總是以某種方式與表示共享知識的知識庫相關聯(lián)。 人工智能領域:本

10、體是一種工程產(chǎn)品,由一個用于描述某種現(xiàn)實情況的特定術(shù)語集和一組顯式定義的公理集組成。 盡管在不同的領域?qū)Ρ倔w的定義方式各不相同,但從內(nèi)涵上來看,不同研究者對于本體的認識是統(tǒng)一的。 即本體是是領域(可以是特定領域的,也可以是更廣的范圍)內(nèi)部不同主體(人、機器、軟件系統(tǒng)等)之間進行交流(對一話、互操作、共享等)的一種語義基礎,本體提供了一種明確定義的共識。 本體的主要作用: 本體提供了一種結(jié)構(gòu)化表示領域知識的手段。本體支持對知識的重用。本體是領域知識的形式化表示。本體還支持將領域的靜態(tài)知識和操作知識進行允離。本缽為人和主體之閾的溝通與交流提供了共享的基礎,也方便了不同領域的系統(tǒng)開發(fā)人員和研究人員之

11、間的溝通與交流。2.2 本體的目標 Ontology的目標是捕獲相關的領域的知識,提供對該領域知識的共同理解,確定該領域內(nèi)共同認可的詞匯,并從不同層次的形式化模式上給出這些詞匯(術(shù)語)和詞匯之間相互關系的明確定義。 不同的系統(tǒng)描述領域的時候使用不同的概念和術(shù)語。所以很難從一個系統(tǒng)中提取知識運用到另一個系統(tǒng)中。開發(fā)可重用的Ontology以推進共享和重用是Ontology研究的一個重要目標。 2.3 本體的建模元語 本體包括五個基本的建模元語: 概念(concepts) 關系(relations) 函數(shù)(functions) 公理(axioms) 實例(instances)概念的定義一般采用框架

12、(frame) 結(jié)構(gòu),包括概念的名稱,與其他概念之間關系的集合,以及用自然語言對該概念的描述。 本體描述的關系有四種:part-of :表達概念之間部分與整體的關系。kind-of :表達概念之間的繼承關系,類似于面向?qū)ο笾械母割惻c子類之間的關系。instance-of :表達概念的實例與概念之間的關系,類似于面向?qū)ο笾械膶ο蠛皖愔g的關系。attribute-of :表達某個概念是另一個概念的屬性。如“價格”是桌子的一個屬性。 在實際的應用中,不一定要嚴格地按照上述5類元語來構(gòu)造Ontology。同時概念之間的關系也不僅限于上面列出的4 種基本關系,可以根據(jù)特定領域的具體情況定義相應的關系,

13、以滿足應用需要。2.4 本體的分類 由于研究本體的機構(gòu)和組織很多,根據(jù)本體不同方面的特性,就存在著不同的本體的分類方式。 根據(jù)本體的通用性級別進行分類:領域本體:針對特定的應用領域?qū)︻I域知識的結(jié)構(gòu)和內(nèi)容進行抽象表示,包括各種領域知識的類型、術(shù)語和概念,并對領域知識的結(jié)構(gòu)和內(nèi)容加以約束,形成描述特定領域中具體知識的基礎。通用或常識性的本體:針對獲取關于世界的通用性知識,提供基本的觀念和概念,如時間、空間、狀態(tài)、事件、過程、行為、部件等。應用本體:針對特定應用領域進行知識建模的抽象定義。表示型的本體:主要描述在知識表示形式化背后的概念化,而不局限于任何特定的領域。 根據(jù)本體概念化的結(jié)構(gòu)數(shù)量和類型進

14、行分類: 術(shù)語學本體:類似于詞典,定義了從不同方面表示知識的術(shù)語。 信息本體:定義了數(shù)據(jù)庫的記錄結(jié)構(gòu),數(shù)據(jù)庫模式是這類本體的一個示例。 知識建模本體:定義了知識的概念化。 根據(jù)本體刻畫描述的現(xiàn)實世界的不同而進行的本體分類: 靜態(tài)的本體:描述世界中靜態(tài)方面的特征,即存在的事物、它們的屬性以及它們之間的關系。 動態(tài)的本體:描述世界中不斷變化的方面,典型的原語概念包括了狀態(tài)、狀態(tài)轉(zhuǎn)換和過程描述世界。 意念型的本體:包括動機、意圖、目標、信念、選擇等。 社會型的本體:包括社會結(jié)構(gòu)、組織結(jié)構(gòu)、聯(lián)盟等。2.5 本體的描述語言 本體的描述語言能夠為領域模型編寫清晰、形式化的概念描述。本體語言一般應滿足以下要

15、求:良好定義的語法(awell一definedsyntxa)良好定義的語義(awell一definedsemnaties)有效的推理支持(effieienterasonings即port)充分的表達能力(suffieientexperssivepower)表達的方便性(eonvenieneeofexperssion) 隨著對本體論的不斷研究,隨之也誕生了許多種本體描述語言,主要包括RDF、RDF-S、OLI、DAML、DAML+OIL、OWL、KIF、SHOE、XOL、OCML、ontolingua、CyeL、Lomo等諸多本體語言。下面將一一介紹這些本體描述語言。2.5.1 RDF(資源描述

16、框架) RDF(ResourceDescriptionFramework)是由W3C組織制定的,是W3C在xML的基礎上推薦的一種標準,用于表示任何的資源信息。它是一種元數(shù)據(jù),即“關于數(shù)據(jù)的數(shù)據(jù)(Data about data),是關于對象數(shù)據(jù)的一種概括性、實質(zhì)性的描述。 用于描述Web頁面或現(xiàn)實世界中的一個實體對象,RDF定義了一個基本的數(shù)據(jù)模型,這個數(shù)據(jù)模型可用XML語法表示,它包括資源(Reosucres)、屬性(Properties)和聲明(Sattemnest)三種對象類型。 RDF的基本結(jié)構(gòu)可以看作“對象-屬性-值”的三元組語法形式,其中對象代表一個資源,屬性代表該資源的特性,值則

17、是該資源特性的量化。 在語義的可互操作性上,RDF比XML有著顯著的優(yōu)勢。它能很自然地用屬性-值的網(wǎng)絡關系來描述資源以及資源之間的關系。 以下代碼為RDF對資源間關系的描述: Eric Miller mailto: Dr. 2.5.2 RDF Schema(RDF模式) RDF Schema是對RDF的擴展,它加入了vocabulary、sturcture和constraint。由于RDF只是為表示語義提供基礎,本身并不能表示語義,因而RDFS是為了表示語義而對RDF的一個擴展。 在RDFS中,最上層的抽象根類結(jié)點是rdf:Resoucre,它又派生出兩個子類rdfs:Clas

18、s和rdf:Prpoerty,任何領域的知識都可以認為是這兩個子類的實例。rdfs:Class語義上代表了領域中的本體,rdf:Porperty則代表了領域中本體的屬性。 RDFS加入了本體語言的基本建模要素,如:類、類繼承、屬性繼承、領域等。通過RDFS可以表示類、槽和側(cè)面,而通過RDF可以表示實例和事實,但是它們都無法支持公理和函數(shù)的表示,也不支持基于類包含關系以外的其他推理機制,且RDFS的表達方式有很大的局限性,對于表達豐富的語義是遠遠不夠的,這些將有待其上層的本體層將RDFS擴展成齊全的本體建模語言。2.5.3 OIL(本體互操作語言) OIL(Ontology Interchang

19、e Language)是一種針對本體的基于互聯(lián)網(wǎng)的表現(xiàn)和推理層。它是由歐盟信息社會技術(shù)委員會下的知識項目(IST-1999-1013)和IBROW(IST-1999-19005)資助建立的,也得到了更廣泛的研究者的參與。 OIL的使用比較廣泛,支持OIL的工具也很多,最著名的有OILEd,是一個基于OIL的本體編輯器,OntoEdit、the FaCT system等工具也都支持OIL。2.5.4 DAML描述語言 DAML(DARPA Agent Markup Language)是由國防高級研究計劃局(DARPA)資助,美國許多研究機構(gòu)參與研究建立的一種描述語言。其目標是開發(fā)一種語言和一組工

20、具為語義互聯(lián)網(wǎng)提供支持。 DAML擴展了RDF,增加了更多的更復雜的類、屬性等定義。它一度很流行,成為網(wǎng)上很多本體的描述語言,直到DAML的研究者和oIL的研究者開始合作,推出了DAML+OIL語言。2.5.5 DAML+OIL描述語言 DAML+OIL提供了很多詞匯使其具有相當強的表達力。它不僅繼承了RDF/RDFS的表達能力,還從描述邏輯中借鑒了很多表達方式,能夠提供足夠的約束條件使得其描述客觀領域知識的能力大大增強。 DAML+OLI語言提供的詞匯包括: 類層次和關系(class,subClassOf,disjoint With,SameClassAs) 枚舉類(oneOf) 屬性層次(

21、Property,subPropertyOf,samePropertyAs) 類的交、并、補(union,Intersection,Complement) 各種屬性的性質(zhì),如反轉(zhuǎn)屬性(inverseOf)、傳遞屬性(TransitiveProparty)等等. 屬性限定類,如屬性域限定(hasClass,toClass),基數(shù)限定(cardinality),屬性值限定(hasValue). 個體實例(Individual,SameIndividual,differentIndividualFrom); 數(shù)據(jù)類型(DataType)2.5.6 OWL(網(wǎng)絡本體語言) OWL(Web Ontolo

22、gy Language)是W3C推薦的語義互聯(lián)網(wǎng)中本體描述語言的標準,它是從DAML十OIL發(fā)展起來的。針對不同的需求OWL有三個子語言:OWL Lite、OWL DL和OWL Full。 OWL中的三種子語言之間的關系是:每個合法的OWL Lite都是一個合法的OWL DL;每個合法的OWL DL都是一個合法的OWL Full;每個有效的OWL Lite結(jié)論都是一個有效OWL DL結(jié)論;每個有效的OWL DL結(jié)論都是一個有效的OWL Full結(jié)論。 這三種子語言與RDF的關系是:OWL Full可以看成是RDF的擴展;OWL Lite和OWL Full可以看成是一個約束化的RDF的擴展;所有

23、的OWL文檔(Lite,DL,Full) 都是一個RDF文檔;所有的RDF文檔都是一個OWL Full文檔:只有一些RDF文檔是一個合法的OWL Lite和OWL DL文檔。 使用時如何選擇適合的子語言: 選擇OWL Lite還是OWL DL主要取決于用戶需要該語言在多大程度上給出了約束的可表達性. 選擇OWL DL還是OWL Full主要取決于用戶在多大程度上需要RDF的元模型機制(如定義類型的類型以及為類型賦予屬性). 在使用OWL Full而不是OWL DL時,推理的支持不可預測,因為目前還沒有完全的OWL Full的實現(xiàn). OWL語言描述的本體示例: animal This class

24、 represents the animal kingdom 2.5.7 其它的本體描述語言 CycL和KFI是擴展了的一階謂詞邏輯語言. Onotlnigua和FL是基于框架的方法,兩種方法都把基于框架的建模原語結(jié)合到一階邏輯框架中. 根據(jù)以上對各種本體表示語言的介紹可知,OWL可被用來明確表示詞匯表中術(shù)語的含義以及術(shù)語間的關系。在表達含義和語義方面,OWL比RDF和RDF-S等語言有更多的表達手段,因此在Web上表達機器可理解內(nèi)容的能力也比這些語言強。2.6 構(gòu)造本體的規(guī)則 明確性和客觀性:即Ontology應該用自然語言對所定義術(shù)語給出明確的、客觀的語義定義。 完全性:即所給出的定義是完

25、整的,完全能表達所描述術(shù)語的含義。 一致性:即由術(shù)語得出的推論與術(shù)語本身的含義是相容的,不會產(chǎn)生矛盾。 最大單調(diào)可擴展性:即向Ontology中添加通用或?qū)S玫男g(shù)語時,不需要修改其已有的內(nèi)容。 最小承諾:即對待建模對象給出盡可能少的約束。2.7 本體的構(gòu)造 (1) Mike Uschold & King的骨架法 該方法論是愛丁堡大學人工智能研究所Michael Uschold在Enterprise Ontology,開發(fā)經(jīng)驗基礎上總結(jié)得出的本體開發(fā)方法。 該方法構(gòu)造本體的主要步驟是: 定所建領域本體的目的和使用范圍. 立本體。這一過程包括三個子步驟:本體獲取、本體編碼和集成等.本體評估

26、。根據(jù)需求描述、能力問題等對本體以及軟件環(huán)境等進行評價.文檔記錄。把所開發(fā)的本體及相關內(nèi)容以文檔形式記錄下來.骨架法可以充分利用現(xiàn)有知識獲取技術(shù),但并沒有就如何確定本體中的概念提出明確建議,這是它的不足之處。 (2) TOVE本體開發(fā)方法論 該方法論是Gruninger和Fox根據(jù)多倫多大學企業(yè)集成實驗室的TOVE項目總結(jié)出來的本體開發(fā)方法。其目的是構(gòu)造企業(yè)本體,包括活動、組織、資源、產(chǎn)品、成本和質(zhì)量等部分。 TOVE方法論包括如下六個步驟: 用情景收集階段。定義可能的應用何解決方案。 非形式化能力問題。定義約束條件,包括能解決什么問題和解決方法。 語形式化。提取非形式化的術(shù)語,然后用本體語言

27、定義。式化能力問題。解決形式化表示能力問題。式化公理。設計術(shù)語定義所遵循的公理用一階謂詞邏輯表示,包括語義或解釋。完備性約束。問題的解決方案必須是完備的。TOVE本體開發(fā)方法特別強調(diào)對本體的評價,它使用的評價主要基于本體的完備性理論。 (3) KACTUS方法 該方法論是Bernaras等人在Esprit TACTUS項目的支持下開發(fā)的。其主要目的是考察復雜系統(tǒng)中知識重用的可能性以及本體能支持的角色。KACTUS方法主要包括三個步驟: 應用說明。提供應用上下文和應用模型所需要的組件。 步設計。對現(xiàn)有的本體進行擴展。 本體求精。保證本體模型既相互依賴,又盡可能一致。 KACTUS方法論在本體求精

28、和結(jié)構(gòu)化方面一定意義,它提出了應用驅(qū)動的本體開發(fā)思想。 (4) Methontology方法 該方法論是西班牙馬德里大學的Asuncion Gomez-Perez等人提出的。它包括三個階段: 管理階段。包括任務的進展情況、需要的資源和質(zhì)量保證等。 發(fā)階段。包括規(guī)范說明、概念化、形式化到執(zhí)行。 護階段。包括知識獲取、系統(tǒng)集成、評價、文檔說明、配置管理等活動。 盡管不同的開發(fā)方法論在獲取領域本體上有不同的思路,但希望構(gòu)造“好”的本體的目標是一致的。2.8 語義 針對什么是語義,從不同角度,有許多不同的理解,主要有以下幾種觀點: 詞的指稱作為意義 該理論認為,詞或詞組的意義就是它們在現(xiàn)實世界上所指的

29、事物。 心理圖像、大腦圖像或思想作為意義 說話者的意圖作為意義 過程語義 詞匯分解學派條件真理模型情景語義學模態(tài)邏輯格語法語義網(wǎng)絡 語義網(wǎng)絡(semantic network)由美國心理學家M.R.Quilian于1968年在研究人類聯(lián)想記憶時提出的。1977年美國觸學者G.Hendrix提出了分塊語義網(wǎng)絡的思想,把語義的邏輯表示與“格語法”結(jié)合起來。 計算機領域:為了便于處理,通常認為語義可以簡單地看作是數(shù)據(jù)所對應的現(xiàn)實世界中的事物所代表的概念的含義,以及這些含義之間的關系,是數(shù)據(jù)在某個領域上的解釋和邏輯表示。 信息集成領域:認為語義就是指模式元素(例如類、屬性、約束等等)的含義,如果該含義

30、(語義)能夠被計算機所“理解”(指能夠通過形式化系統(tǒng)解釋、推理并判斷),那么該信息就是能夠被計算機所處理的信息。2.9 基于本體的信息集成 本體具有良好的概念層次結(jié)構(gòu)和對邏輯推理的支持。 通過建立各自的領域本體和基于本體的知識推理機制,對不同領域本體進行參比和映射,對這些異構(gòu)系統(tǒng)進行集成,可以實現(xiàn)空間信息的集成和共享。2.10.1 本體推理 本體推理是計算機對本體知識理解的一種重要表現(xiàn)。使用本體的目的之一,就是想通過對本體的形式化描述,使得計算機能夠理解本體所描述的知識,從而 “智能的”完成任務。 本體的推理有多方面的應用:對于本體的建立者,推理的主要作用是檢測沖突,優(yōu)化表達和本體融合;對于本

31、體的使用者,推理的作用主要是獲得本體中的隱含的概念和關系,并運用這些隱含的概念和關系解決問題。2.10.2 本體推理的方法OWL DL的語義基于描述邏輯(Description Logics),描述邏輯是一個知識表示語言的群體。它們專注于描述概念的語義(semantics),因此很適合本體的推理。利用推理自動地在概念層次 (hierarchy)中分離出新的概念,同時檢查規(guī)范(specifications),消除矛盾。描述邏輯是在命題邏輯(propositional logics)和一階謂詞邏輯(First order Logic)上發(fā)展起來的。命題邏輯的概念只能作為原子命題存在,表達力明顯不足

32、。而一階謂詞邏輯又由于表達力過強而導致相關的推理算法過于復雜,無法有效地控制推理時間,它們都不適合用于建立本體。描述邏輯目的就是在表達力與推理復雜度之間取得平衡。而且,描述邏輯可以較好的實施推理。2.11 本體與地理信息 地理信息具有豐富的語義內(nèi)涵,它的語義內(nèi)容可以通過本體充分和準確的表達出來,為基于語義的地理信息共享和互操作提供前提和保障。地理信息語義的表達實際上就是領域內(nèi)共享知識的表達,而知識表達包含兩層含義,首先是表達概念,然后是組織概念。表達概念是意向定義概念的過程;組織概念是明確概念間的關系,特別是帶有明確繼承語義的泛化-特例關系。 為了充分理解本體在地理信息中建模的作用,對Gome

33、s J 1995年為計算機表示建立自然領域、邏輯領域、表示領域和實現(xiàn)領域四個領域進行擴展,在其中增加了一個識別鄰域。 自然領域是真實的世界,包括了將在計算機中建模的真實世界的對象和現(xiàn)象。 識別領域捕捉人們對于自然領域的感知,感知諸如河流、土壤等概念。 邏輯領域包括對于對象和現(xiàn)象的形式化的定義,主要是地理對象的形式化的概念。 表示領域?qū)υ谶壿嬵I域中的元素,例如對象和域限定了其有限的符號描述。 實現(xiàn)領域?qū)⒈硎绢I域中的元素映射成用計算機語言實現(xiàn)的數(shù)據(jù)結(jié)構(gòu),即用數(shù)據(jù)結(jié)構(gòu)來實現(xiàn)前一領域的概念,包括矢量和柵格幾何對象。3.1 地理本體( Geo-Ontology ) 地理本體:是把有關地理科學領域的知識、

34、信息和數(shù)據(jù)抽象成由一個個具有共識的對象(或?qū)嶓w) ,并按照一定的關系而組成的體系,同時進行概念化處理和明確的定義,最后以形式化表達的理論與方法。 地理本體是一種領域本體,是有效解決異構(gòu)空間信息獲取、描述、表達以及重用的理論技術(shù)體系。通過研究空間信息的語義表達、共享和服務描述和組合,為空間信息提供具有計算機可以理解的語義,從而滿足智能體對Web上異構(gòu)、分布信息的檢索和訪問,實現(xiàn)網(wǎng)上信息資源在語義層上的全方位互聯(lián),并在此基礎上,為實現(xiàn)更高層的、基于知識的智能應用奠定基礎。3.2 地理本體應用的意義 為異構(gòu)空間信息的共享提供了理論依據(jù)。利用本體技術(shù)理論獲取、描述、表達資源環(huán)境空間信息領域的知識,提供

35、對該領域知識的共同理解,確定該領域內(nèi)共同認可的詞匯,并從不同層次的形式化模式上給出這些詞匯(術(shù)語)和詞匯間相互關系的明確定義。 促進來自于不同領域的研究人員之間的交流、軟件主體間的通信和互操作、異構(gòu)數(shù)據(jù)源的集成等。實現(xiàn)不同個人、部門之間對資源環(huán)境空間信息知識的共同理解。 為空間信息集成與共享、空間數(shù)據(jù)挖掘、空間服務互操作的問題提供了一條可行之路。使地理信息系統(tǒng)更加全面和深入地與各行各業(yè)的信息系統(tǒng)有機地融合為一個整體,極大地促進了地理信息系統(tǒng)的社會化和普及。3.3 基于本體的地理信息語義共享3.4 地理本體的概念分類 (1) 概念分類理論 通過分析什么是概念、概念的特性、概念之間的關系以及概念的

36、分類,從分類關系所涉及的參數(shù)性質(zhì)入手,提出的一套用于指導概念分類的可行理論。 Guarino認為概念之間的差別不僅體現(xiàn)在概念的定義上,同時也體現(xiàn)在概念的某些特性上。根據(jù)這些特性,他歸納出概念的元特性。元特性是指有關特性的特性,概念的基本元特性包括:持久特性、非持久特性、反持久特性、半持久特性、載體標識特性、支持標識特性、外部依賴特性等。 概念分類理論力求明確表示概念的復雜語義以及概念、概念的屬性、變量及約束規(guī)則之間的關系,主要包括重要領域的分類、特例、事物之間的關系、事物的屬性、事物的功能和事物之間的約束規(guī)則等,因此,概念分類可以從概念的基本元特性出發(fā),以分類學中基本層次關系作為概念分類的骨架

37、,在分類時附加概念之間的關系、屬性及事物之聞的約束規(guī)則等。(2) 分類的基本方法 分類的基本方法有線分類法和面分類法。 線分類法:也稱為層級分類法,是將分類對象按所選定的若干個屬性或特征,作為分類的劃分基礎,逐次地分成相應的若干個層級的類目,并排成一個有層次的,逐級展開的分類體系。 面分類法:是把給定的分類對象依據(jù)其本身固有的各種屬性分成相互之間沒有隸屬關系的面,每個面中都包含了一組類目。 實踐證明線分類法和面分類法各有其優(yōu)、缺點。在資源環(huán)境信息分類實踐中,高層的定性信息(大類、小類)分類適合使用線分類法,定量屬性往往處于類別的較低層次,適合應用面分類法。(3) 地理本體的概念類別及其表達由于

38、地理概念構(gòu)成多樣,具有不同的粒度,且地理概念所代表的地理實體的空間特征具有模糊性,因此地理概念分類是一個復雜的問題,一般采用層級分類是一個比較可行的方法。根據(jù)地理概念的構(gòu)成屬性把其分為自然地理實體概念和人文地理實體概念。 根據(jù)地理空間感念分類方法,采用OWL對地理本體進行定義,其部分代碼如下: /人文地理實體類(HumanGeoEntity)定義 rdfs:subClassop /建筑(Building)定義 3.5 地理本體的空間關系 地理本體包含多種空間關系,如拓撲、方向、距離等。拓撲關系是空間關系中最重要的基本關系。(1) 拓撲關系:用來描述空間實體之間相鄰、包含和相交的關系。 拓撲是研

39、究在拓撲變換下能夠保持不變的幾何屬性拓撲屬性??臻g關系主要關注地理實體的連接、包含、相鄰和相離關系。拓撲空間中空間對象的性質(zhì)和相互關系比較復雜,拓撲空間中的基本對象有弧、環(huán)、面和點等,不同對象間有多種的拓撲關系類型。 空間拓撲關系描述有三種方法:基于點集的四交模型、基于點集的九交模型和基于維數(shù)擴展到九交模型。(2) 方向關系:是描述空間實體之間在空間上的排列次序。 針對點對象,Andrew Frank提出了“基于圓錐”和“基于投影”兩種方向劃分方法。Roop和Egenthofer提出了一種3 X3的“方向關系矩陣”表示方法。(3) 距離關系:用于描述空間實體之間的距離等關系。距離關系的表示分為

40、絕對距離和相對距離關系。絕對距離關系直接表示兩個空間對象之間的距離,相對距離關系通過與第3個對象的比較,間接表示兩個對象間的距離。3.6 地理本體的語義關系 語義關系比較復雜,也更難以進行定義。不同類型的語義關系稱為“語義場型”,語義場型分為四種類型:分類場型、分元場型、概念相關場型、功能相關場型。分類場型:分類關系是形成概念體系的一種基本關系。分類場型中處于同一義場的各個義位都是同一類的事物等。分類場型一般是多層次的。在語義場中,上一層的義位稱為上位,下一層的義位稱為下位。分類場型的上下義位之間是領屬關系,即上位表示義場的領域,下位表示該領域中的分類,下位可以繼承上位的基本義素。分元場型:又

41、稱為構(gòu)件關系,是一種空間的部分一整體關系,以組合和聚合等形式構(gòu)成。構(gòu)件場型中任何下位都是其上位的一個構(gòu)件,即上位是整體,下位表示整體的一個構(gòu)件。概念相關場型:概念相關指兩個實體的概念間的語義關系,例如相似概念、相反概念等,主要包括對立場型和同義場型。同一層次的義位稱為平位。同一概念的若干義位變體稱為同位。對立場型是由平位之間韻關系決定的,即平位之間是一種對立關系。功能相關場型:功能相關是把具有相關作用的兩個實體順序聯(lián)系起來的一種關系,可用于描述一個地理過程所涉及的兩種概念關系。最常見的是有序場型。有序場型中處于同一場型的所有平位都是有序的。3.7 地理本體的形式化語言表達 盡管地理本體在本質(zhì)上

42、是獨立于任何一種具體的表示語 言,但必須選擇一種形式化的語言去描述它。本體的表示語言有十幾種,可分為傳統(tǒng)的本體表示語言和用于網(wǎng)絡環(huán)境下的本體標記語言兩大類。 傳統(tǒng)的本體語言主要有Ontolingua、KIF、Loom、OKBC (Open Knowledge Base Connectivity)、OCML(Operational Conceptual Modelling Language)和FLogic等. 本體標記語言主要有SHOE(Simple HTML Ontology Extensions)、RDF、RDFS、OWL+OIL和OWL等。3.8 幾種地理本體語言的比較語言名稱語言名稱特點

43、XML結(jié)構(gòu)化文檔的表層語法,對文檔沒有任何語義約束。XML Schema用來確定XML文檔的結(jié)構(gòu)。而不能用來確定元素的具體含義以及元素之間的語義聯(lián)系。能用一種層次的方式組織元素,不過這種層次并不包含語義信息,而僅僅是提供了一種語法來復用一些簡單的結(jié)構(gòu)以構(gòu)造更復雜的結(jié)構(gòu)。因此通過XML Schema描述的數(shù)據(jù)缺乏語義信息。RDF對象(或者資源)以及它們之間關系的數(shù)據(jù)模型,為數(shù)據(jù)模型提供了簡單的語義,這些數(shù)據(jù)模型能夠用XML語法進行表達。RDF可以看作元數(shù)據(jù)層,RDF的數(shù)據(jù)模型提供了一個抽象的概念框架來描述元數(shù)據(jù)。RDF Schema在RDF的基礎上提供了更多建模原語,倒如,提供類(Class)的

44、定義。也提供定義特性之間關系的機制。RDF Schema就是作為RDF的數(shù)據(jù)定義模型而出現(xiàn)的,在RDF Schema中所有的類和特性本身也被定義為資源,使得能夠更加有效地利用資源。OWL在RDF和RDFS基礎上,通過增加更多建模原語來描述特性、類以及它們之間的關系,并針對特性提供了更加豐富的類型定義和屬性描述。OWL采用面向?qū)ο蟮姆绞絹砻枋鲱I域知識即通過類和屬性來描述對象。并誦討公坤桌橘抹汶牡樊和屬件的特征和關系。3.9 地理本體概念與地理信息數(shù)據(jù)模型的關地理本體概念與地理信息數(shù)據(jù)模型的關系系 本體的概念是人們對地理世界的抽象認識,表達了地理世界的語義信息,而面向?qū)ο蠹夹g(shù)中的類、對象以及地理信

45、息系統(tǒng)現(xiàn)行的數(shù)據(jù)模型則是計算機世界中地理信息系統(tǒng)設計思想的表現(xiàn)形式,有必要研究它們之間的關系,保證人們對地理世界的抽象認識準確和完整地映射到計算機世界。地理本體概念與面向?qū)ο蠹夹g(shù)的關系本體概念與面向?qū)ο蠹夹g(shù)中類的聯(lián)系1. 本體概念與面向?qū)ο蠹夹g(shù)中類的概念是密切地聯(lián)系在一起的。本體概念系統(tǒng)是人們對地理世界的認識,是人類對客觀世界的抽象。本體概念通過面向?qū)ο蠹夹g(shù)被映射到計算機的比特世界,表現(xiàn)為一個描述人們對地理世界認識的類庫。 本體概念和面向?qū)ο蠹夹g(shù)的類分別是現(xiàn)實地理世界分別在人類思維和計算機軟件系統(tǒng)中的表達,是同一客觀世界分別在人類思維和計算機世界的映射。 本體的概念與面向?qū)ο蠹夹g(shù)的有機結(jié)合,可

46、以實現(xiàn)以下兩個目的:首先,在建立特定領域的地理信息系統(tǒng)的過程中,本體系統(tǒng)可以充當面向?qū)ο箝_發(fā)工具的標準,對所有的類和對象提供語義約束,并把本體概念以面向?qū)ο蠹夹g(shù)的類庫形式表現(xiàn)出來,對地理信息系統(tǒng)的建立起到了共同模型的作用,使地理信息系統(tǒng)的開發(fā)者和使用者共同擁有一個相同的真實世界的模型;其次,在不同領域的地理信息系統(tǒng)的集成和互操作過程中,不同領域的本體系統(tǒng)借助各自的類庫進行交流。本體概念與面向?qū)ο蠹夹g(shù)中類和對象的區(qū)別本體是一種知識交流復用的思想,是異構(gòu)系統(tǒng)知識的抽象,是系統(tǒng)集成的工具。類和對象可以用來體現(xiàn)本體思想,也可以實現(xiàn)構(gòu)件編碼。在系統(tǒng)的分析和設計階段,當類和對象表達的是地理實體的內(nèi)涵和外延

47、時,它們與本體概念和地理實體是等價的,是一個問題在兩個不同階段一系統(tǒng)設計和實現(xiàn)過程的不同的表達方式。當類和對象僅僅為了軟件復用,描述的一組數(shù)據(jù)和對該數(shù)據(jù)的操作時(如輸入輸出類,或一個算法類),則本體概念與這種類和對象之間沒有可比性。面向?qū)ο髷?shù)據(jù)模型與傳統(tǒng)數(shù)據(jù)模型之間的關系在傳統(tǒng)的地理信息系統(tǒng)數(shù)據(jù)模型中將基于對象的模型用矢量結(jié)構(gòu)表達,而將基于場的模型用柵格結(jié)構(gòu)表達。而在基于本體的地理空間中,可以將對象和連續(xù)場這兩種看似對立的數(shù)據(jù)模型統(tǒng)一在面向?qū)ο蟮臄?shù)據(jù)模型中。在基于本體的地理數(shù)據(jù)模型中起著核心作用的是本體概念與類,對象與矢量模型和柵格模型之間的映射關系,提供上述映射關系,建立了本體概念與矢量和柵

48、格模型之間的聯(lián)系。3.10 地理本體建模 本體的開發(fā)和建模到目前為止還沒有統(tǒng)一的標準,基本是開發(fā)者直接用自身熟悉的方式和方法構(gòu)建本體。本體開發(fā)方法論的發(fā)展歷史從時間上來看還是比較短的。 目前比較典型的構(gòu)造地理本體的方法有以下幾種: 針對企業(yè)建模過程的Uschold和King方法; 基于開發(fā)面向商業(yè)過程和行為模型的Gruninger和Fox方法; 用于研究復雜系統(tǒng)中知識重用的可行性和Ontology在其中的作用的Berneras方法; 用于在知識層上構(gòu)造Ontology的METHONTOLOGY方法; 用于自然語言處理的SENSUS方法。3.11 五種地理本體構(gòu)造方法的比較3.12 地理本體的構(gòu)

49、建流程圖3.13 地理本體建模工具 Protege是由斯坦福大學的醫(yī)學情報學研究組(Stanford Medical Informatics ) 開發(fā)的一個開放源碼的本體編輯器,它是用Java編寫的。本體結(jié)構(gòu)以樹形的層次目錄結(jié)構(gòu)顯示,用戶可以通過點擊相應的項日來增加或編輯類、子類、屬性、實例等,使用戶在概念層次上設計領域模型,所以本體工程師不需要了解具體的本體表示語言。 Jena是由HP公司開發(fā)的一個Java開發(fā)工具包。Jena本體解析器包括三部分,對RDF的解析、對RDQL的查詢支持和對OWL的解析。Jena提供了很多接口來訪問和處理RDF。3.14 國外地理本體論的研究現(xiàn)狀 1999年Egenhofer主持的“空間信息一體化的協(xié)作研究”項目,集中研究空間與地理數(shù)據(jù)庫的語義互操作; 1999年Findler和Malyankar主持的“空間知識的表達與分發(fā)”項目,研究建立沿海實體(如海岸線、潮汐面等)的本體論; 1999年Mark和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論