本體理論與領(lǐng)域本體的構(gòu)建_第1頁
本體理論與領(lǐng)域本體的構(gòu)建_第2頁
本體理論與領(lǐng)域本體的構(gòu)建_第3頁
本體理論與領(lǐng)域本體的構(gòu)建_第4頁
本體理論與領(lǐng)域本體的構(gòu)建_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二章 本體理論與領(lǐng)域本體的構(gòu)建2.1本體理論2.1.1 本體的基本概念本體論(Ontology)的概念最初起源于哲學(xué)領(lǐng)域,是形而上學(xué)理論研究的一 個(gè)分支,與認(rèn)識(shí)論相對(duì)。認(rèn)識(shí)論研究人類知識(shí)的本質(zhì)和來源,即研究主觀認(rèn)知, 而本體論研究的則是客觀存在。Ontology 一方面研究存在的本質(zhì),另一方面研究 客體對(duì)象的理論定義,即整個(gè)現(xiàn)實(shí)世界的基本特征。現(xiàn)在哲學(xué)領(lǐng)域較多翻譯為本 體論”經(jīng)過多年的演進(jìn),到今天,經(jīng)過人們對(duì)本體”這一概念的重新理解和定位,本體的理論與方法早已被信息領(lǐng)域采用,用于知識(shí)的組織、表示、共享和重 用。本體在計(jì)算機(jī)學(xué)科的使用可以追溯到上個(gè)世紀(jì)80年代,Alxenader在1986年發(fā)

2、表的文章被視為本體在計(jì)算機(jī)領(lǐng)域獲得不同于哲學(xué)領(lǐng)域的新的研究的起點(diǎn)。 隨后Ontolgoy在人工智能領(lǐng)域界獲得穩(wěn)步的發(fā)展,并被逐漸賦予了新的含義8-9。 1991年,在人工智能領(lǐng)域,Neches等人最早給出Ontology定義,Neches認(rèn)為10“ An ontology defines the basic terms and relations comprising the vocabulary of a topic area,as well as the rules for combining termsand relations to define extensions to the v

3、ocabulary.即一個(gè)本體給出構(gòu)成相關(guān)領(lǐng)域詞匯的基本術(shù)語和關(guān)系,以及利用 這些術(shù)語和關(guān)系構(gòu)成的規(guī)則定義這些詞匯的外延規(guī)則。”本體定義了組成主題領(lǐng)域的詞匯表的基本術(shù)語及其關(guān)系,以及結(jié)合這些術(shù)語和關(guān)系來定義詞匯表外延的 規(guī)則11 。 1993年美國(guó)斯坦福大學(xué)知識(shí)系統(tǒng)實(shí)驗(yàn)室(Knowledge System Laborary, 簡(jiǎn)稱KSL)的Gruber給出了本體在信息科學(xué)領(lǐng)域被廣泛接受的定義:“An ontologyis an explicit specification of a conceptualization 12。即 本體是概念化的明確的規(guī) 范化說明”這也是最著名并被引用最為廣泛的定

4、義。1995年Guarino和Giaretta 將本體定義為13本體是概念化的明確部分的說明一種邏輯語言的模型?!边@個(gè)定義與Gruber的理解有異曲同工之妙。隨后在1997年W.N.Borst對(duì)Gruber的定 義進(jìn)行了引申,提出了 本體是共享概念模型的形式化規(guī)范說明 ”以及1998年 J.Studer的 本體是共享概念模型的明確的形式化的規(guī)范說明”本體的定義隨著時(shí)間的推移也在進(jìn)行著不斷的變化發(fā)展,為明確起見,現(xiàn)將 本體發(fā)展史中較有代表性的定義列表如下:表2.1本體發(fā)展史中的定義列表時(shí)間/提出人定義1991/Neches一個(gè)本體給出構(gòu)成相關(guān)領(lǐng)域詞匯的基本術(shù)語 和關(guān)系,以及利用這些術(shù)語和關(guān)系構(gòu)成

5、的規(guī)© 1 *>4-2010 Chirui Academic Journal Ekctronic PuKlijihing House. All rights reserved, http:/'/wavi. Jidt則定義這些詞匯的外延規(guī)則1993/Gruber本體是概念化的明確的規(guī)范化說明1995/Guarino 和 Giaretta本體是概念化的明確部分的說明一種邏輯語言的模型1996/ Bernaras 等本體提供了一種用來顯式地描述概念化的方式1997/W.N.Borst本體是共享概念模型的形式化規(guī)范說明1997/ Swartout本體是一個(gè)為描述某個(gè)領(lǐng)域而按繼承

6、關(guān)系組織起來作為一個(gè)知識(shí)庫骨架的一系列術(shù)語1998/J.Studer本體是共享概念模型的明確的形式化的規(guī)范說明2000/ Fen sel本體是對(duì)一個(gè)特定領(lǐng)域中重要概念的共享形式化的描述2001/ Noy F.N.本體是對(duì)某個(gè)領(lǐng)域中的概念形式化的明確表示,每個(gè)概念的特性描述了這個(gè)概念的各個(gè)方面及其約束的特征和屬性2002/Fonseca本體是以某一觀點(diǎn)用詳細(xì)明確的詞匯表描述 實(shí)體,概念,特性和相關(guān)功能的理論2003/Starlab本體必需包括所使用術(shù)語的規(guī)范說明,決定 這些術(shù)語含義的協(xié)議,以及術(shù)語之間的聯(lián)系, 來表達(dá)概念由上述列表可見,人們對(duì)本體的定義和理解是有一個(gè)逐步認(rèn)識(shí)的過程的。盡 管本體的

7、定義有很多不同的方式和不同的側(cè)重點(diǎn),但從內(nèi)涵上來講,本體的概念有下面四層含義:概念化(conceputalization):通過抽象出客觀世界中一些現(xiàn)象(phenomenon的相 關(guān)概念而得到的模型,其表示的含義獨(dú)立于具體的環(huán)境狀態(tài)。 明確(explicit):概念與概念之間的聯(lián)系及使用這些概念的約束都被明確定義。(3) 形式化(formal):有精確的數(shù)學(xué)描述,是計(jì)算機(jī)可讀的。共享(Share):本體中體現(xiàn)的是共同認(rèn)可的知識(shí),反映的是相關(guān)領(lǐng)域中公認(rèn)的 概念集,它所針對(duì)的是團(tuán)體而不是個(gè)體14。可見這些不同的研究者雖然各執(zhí)己見,但對(duì)本體的內(nèi)涵卻認(rèn)識(shí)一致,都把本 體當(dāng)作某個(gè)領(lǐng)域內(nèi)不同主體(人、代理

8、、機(jī)器等)之間進(jìn)行交流(對(duì)話、互操作、 共享等)的語義基礎(chǔ)。其實(shí),本體就是通過對(duì)于概念、術(shù)語及其相互關(guān)系的規(guī)范 化描述,勾畫出某一領(lǐng)域的基本知識(shí)和描述語言,是一個(gè)已經(jīng)得到公認(rèn)的形式化 的知識(shí)表示體系,包含詞表(或名稱表/術(shù)語表),詞表中的術(shù)語全是與某一專業(yè)領(lǐng)7© 1 *>4-2010 China Academic Journal Electronic Publijihing House. All rights reserved,http:/'/ki.iidt域相關(guān)的,而邏輯聲明全部用來描述術(shù)語的含義及關(guān)系。2.1.2本體的分類1、按照領(lǐng)域依賴程度:(1)頂層

9、(top-level)本體:描述的是最普通的概念及概念之間的關(guān)系,如空 間、時(shí)間、事件、行為等,完全獨(dú)立于特定的問題和領(lǐng)域,其他本體都是該類本 體的特例。(2)領(lǐng)域(domain)本體:描述的是特定領(lǐng)域(醫(yī)學(xué)、地理等)中的概念及概念 之間的關(guān)系。(3)任務(wù)(task)本體:描述的是特定任務(wù)或行為中的概念及概念之間的關(guān) 系。(4)應(yīng)用(application)本體:描述的是依賴于特定領(lǐng)域和任務(wù)的概念及概念 之間的關(guān)系。在這個(gè)分類當(dāng)中,領(lǐng)域本體和任務(wù)本體是處于同一個(gè)研發(fā)層次的,它們都能應(yīng)用頂層本體中定義的詞匯來描述自己的詞匯。應(yīng)用本體既能應(yīng)用領(lǐng)域本體中的概念,也能引用任務(wù)本體中的詞匯。2、按照細(xì)化

10、程度Guari no從兩種不同的維度對(duì)本體進(jìn)行劃分。除了依據(jù)對(duì)領(lǐng)域的依賴程度分 類,還提出了以詳細(xì)程度分類。詳細(xì)程度是相對(duì)的、模糊的一個(gè)概念,是描述或 刻畫建模對(duì)象的程度。參考(refere nee本體:詳細(xì)程度高。共享(shareable本體:詳細(xì)程度低。3、按照形式化程度(1)高度非形式化:用自然語言松散表示。(2)結(jié)構(gòu)非形式化:用限制的結(jié)構(gòu)化的自然語言表示。(3)半形式記:用半形式化(人工定義的)語言表示。(4) 嚴(yán)格形式化:所有術(shù)語都具有形式化的語義,能在某種程度上證明完 全性和合理性。4、按照是否具備推理功能(1)輕量級(jí)本體(Lightweight ontology):輕量級(jí)本體不具

11、備邏輯推理功能, 例如敘詞表和WordNet。(2)中級(jí)本體(Middle ontology):中級(jí)本體具有簡(jiǎn)單的邏輯推理功能,系統(tǒng) 可以識(shí)別一階謂詞邏輯的表達(dá)式。(3)重量級(jí)本體(Heavyweight。ntology):重量級(jí)本體具有復(fù)雜的邏輯推理功能,系統(tǒng)可以識(shí)別更加復(fù)雜的二階謂詞邏輯的表達(dá)式,并為更加復(fù)雜的推理功能的實(shí)現(xiàn)預(yù)留了接口,女口 Cyc本體系統(tǒng)I9】。8© 1 *>4-2010 Chirui Academic Journal Elec Iran ic PuKlijihing House. Al rights reserved, http: /'/wav

12、.cnk i. iidt5、按本體描述對(duì)象的不同,Uschold把本體分為特殊領(lǐng)域本體(如醫(yī)藥、地 理、金融等)、一般世界知識(shí)本體、問題求解本體和知識(shí)表示語言本體等。6按不同的研究主題15:(1) 知識(shí)表示本體(Knowledge Representation ontologies)如 Frame Ontology和斯坦福大學(xué)知識(shí)系統(tǒng)實(shí)驗(yàn)室提出的知識(shí)描述語言KIF(K nowledge In tercha ngeFormat)。(2) 通用或常識(shí)本體(General/Common ontologies,女口 Cyc本體系統(tǒng)。到 2000年為止,Cyc的常識(shí)庫已有了 1,600,000條知識(shí)和幾

13、百個(gè)微理論 (micro-theory)。(3) 領(lǐng)域本體(Domain ontologies),如基因本體 GO(Gene ontologies)愛丁 堡大學(xué)企業(yè)本體。(4) 語言學(xué)本體(linguistic ontologies),關(guān)于語言、詞匯等的本體,典型實(shí) 例有 GUM(Generalized Upper Model),WordNet 和 MindNet 等。(5) 任務(wù)本體(Task ontologies),主要研究如 Chandrasekaran等人的關(guān)于任 務(wù)和問題求解方法本體的研究。除了上述幾種分類方法外,1999年,Perez和Benjamins在分析和研究了各 種本體分類

14、法的基礎(chǔ)上,歸納出10種本體:知識(shí)表示本體、常識(shí)本體、頂級(jí)本體、元(核心)本體、領(lǐng)域本體、語一言本體、任務(wù)本體、領(lǐng)域一任務(wù)本體、方法 本體和應(yīng)用本體。這種分類法是對(duì) Guarino提出的分類方法的擴(kuò)充和細(xì)化,但是 這10種本體之間存在交叉,層次不夠清晰。2.1.3本體的功能與作用1、本體為人和主體之間的溝通和交流提供了共享的基礎(chǔ),也方便了不同領(lǐng) 域的系統(tǒng)開發(fā)人員和研究人員之間的溝通,它是人機(jī)在語義上交互的最好的基 礎(chǔ)。而開發(fā)領(lǐng)域本體的主要目的之一就是在人們和軟件智能之間對(duì)信息結(jié)構(gòu)的理 解提供一種可共享的、共同的理解機(jī)制。2、本體支持對(duì)于知識(shí)的重用。本體提供了獨(dú)立于應(yīng)用的描述方法使之可在 不同系

15、統(tǒng)間重用。例如在基于構(gòu)件的軟件開發(fā)過程中,開發(fā)知識(shí)系統(tǒng)時(shí)知識(shí)工程 師可以將本體論概念引入知識(shí)工程,詳細(xì)說明模型中的概念、實(shí)例、關(guān)系和公理 等實(shí)體,并以此建立領(lǐng)域本體。然后針對(duì)屬性提出本體建模概念化分析的形式化 方法,解決知識(shí)共享中的問題。此舉有效的提高了工作效率,促進(jìn)了來自不同領(lǐng) 域的研究人員和組織間的交流。3、本體提供了一種結(jié)構(gòu)化的表示領(lǐng)域知識(shí)的形式化方法。在本體中,明確說明了領(lǐng)域概念及概念之間的關(guān)系,并且支持對(duì)領(lǐng)域規(guī)則的描述,是領(lǐng)域知識(shí)的形式化表示。4、知識(shí)本體可以明確領(lǐng)域假設(shè),使領(lǐng)域公理得到明確描述從而達(dá)成共知。9© 1 *>4-2010 China Academic J

16、ournal ElBttranic PuKlijihing House. Al rights reserved, http:5、本體有助于知識(shí)的標(biāo)準(zhǔn)化。本體為人們描述目標(biāo)世界提供了一組通用詞 匯,而這種通用的詞匯正是實(shí)現(xiàn)知識(shí)系統(tǒng)化的基礎(chǔ)。 通用詞匯和知識(shí)的系統(tǒng)化有 利于實(shí)現(xiàn)知識(shí)的標(biāo)準(zhǔn)化。2.1.4本體的應(yīng)用目前本體已經(jīng)廣泛應(yīng)用于人工智能、知識(shí)工程及其相關(guān)領(lǐng)域。本體的功能及 其應(yīng)用領(lǐng)域大致可以概括為三類:作為知識(shí)表示方法,應(yīng)用于知識(shí)工程和知識(shí)管 理;作為系統(tǒng)分析方法,應(yīng)用于信息建模、面向?qū)ο蠓治龊蛿?shù)據(jù)庫設(shè)計(jì);作為信 息語義的形式化表示方法,應(yīng)用于異構(gòu)信息集成、多智能體系統(tǒng)、語義Web等。具體來說

17、可以分為以下幾個(gè)方面:1、信息檢索本體具有的良好的概念層次結(jié)構(gòu)和對(duì)邏輯推理的支持,因而在信息檢索,特 別是在基于知識(shí)的檢索中得到了廣泛的應(yīng)用?;诒倔w的信息檢索的基本設(shè)計(jì)思 想可以總結(jié)如下:(1)在領(lǐng)域?qū)<业膸椭?,建立相關(guān)領(lǐng)域的本體;(2)收集信息源中的數(shù)據(jù),并參照已建立的本體把收集來的數(shù)據(jù)按規(guī)定格式存 儲(chǔ)在元數(shù)據(jù)庫(RDB(關(guān)系數(shù)據(jù)庫),KDB(知識(shí)數(shù)據(jù)庫)等)中;(3)對(duì)用戶檢索界面獲取的查詢請(qǐng)求,查詢轉(zhuǎn)換器按照本體把查詢請(qǐng)求轉(zhuǎn)換成規(guī)定的格式,在本體的幫助下從元數(shù)據(jù)庫中匹配出符合條件的數(shù)據(jù)集合,檢索的結(jié)果經(jīng)過定制處理返回給用戶。表2.2本體應(yīng)用于信息檢索的項(xiàng)目項(xiàng)目說明2(Onto) Ag

18、e nt幫助用戶檢索所要的 www上已有的Ontology,主要采用參照 Ontology, 即以www上已有的Ontology為對(duì)象建立起來的 Ontology,保存各類Ontology的元數(shù)據(jù)。On tobroker面向www上的網(wǎng)頁資源,目的是幫助用戶檢索所需的網(wǎng)頁,這些網(wǎng)頁含有用戶關(guān)心的內(nèi)容。SKC解決信息系統(tǒng)語義異構(gòu)問題,實(shí)現(xiàn)異構(gòu)自治系統(tǒng)間的互操作,通過在Ontology上的一個(gè)代數(shù)系統(tǒng)來實(shí)現(xiàn)Ontology之間的互操作,實(shí)現(xiàn)異構(gòu)系統(tǒng)之間的互操作。2、電子商務(wù)電子商務(wù)的出現(xiàn),為來自不同領(lǐng)域、不同地區(qū)甚至不同國(guó)家的商業(yè)伙伴之間 進(jìn)行交易提供了更為方便快捷的商務(wù)平臺(tái),因此受到了企業(yè)和商家

19、越來越多的重 視。但由此而來的電子商務(wù)交易方的大量產(chǎn)品描述、目錄和文檔,以及亟待解決的異構(gòu)問題成為B2B電子商務(wù)發(fā)展的瓶頸所在。10© 1 *>4-2010 Chirui Academic Journal Ekctronic PuKlijihing House. All rights reserved, http:/'/wavi. Jidt本體在B2B的通信中可以起到信息集成的作用,它將信息的表示分為三個(gè) 層次:語法層、數(shù)據(jù)模型層和本體層,其中語法層與使用XML序列化表示的文檔實(shí)例相對(duì)應(yīng);數(shù)據(jù)模型層將語法層中的差異抽取出來進(jìn)行統(tǒng)一表示,并用對(duì)象-屬性-值的形式對(duì)產(chǎn)品進(jìn)行

20、描述;而本體層則定義不同產(chǎn)品和文檔標(biāo)準(zhǔn)提供的 各種信息的術(shù)語,有效地幫助其完成 Web數(shù)據(jù)的語義處理和管理。3、數(shù)字圖書館數(shù)字圖書館是社會(huì)信息基礎(chǔ)結(jié)構(gòu)中信息資源管理、 存儲(chǔ)和傳輸?shù)幕窘M織形 式,擁有豐富的超容量多媒體介質(zhì)的數(shù)字化信息資源,依托網(wǎng)絡(luò)為信息需求者提 供快捷高效的數(shù)字化圖書館信息服務(wù)。但各類信息常在具體系統(tǒng)條件限制下用專 門語言定義組織為內(nèi)部結(jié)構(gòu)和格式, 難以有效進(jìn)行機(jī)器支持的檢索、 解析、處理 和交換,更不要說進(jìn)行跨文獻(xiàn)單元、數(shù)據(jù)類型、數(shù)據(jù)層次和系統(tǒng)范圍的信息挖掘、 抽取、綜合分析描述、轉(zhuǎn)換了。本體的出現(xiàn)就極大的解決了語義知識(shí)缺乏的問題, 為XML與RDF等技術(shù)提供語義支持。在進(jìn)

21、行信息資源整合時(shí),本體可以靈活 處理各類信息資源,有效識(shí)別信息資源的類型,提供資源庫領(lǐng)域知識(shí)的規(guī)范描述, 提供元數(shù)據(jù)映射方案,為智能代理與信息環(huán)境之間提供基于語義的理解機(jī)制,此外還可作為跨平臺(tái)、跨系統(tǒng)之間的通信中介存在,為揭示知識(shí)間的語義關(guān)系提供 了清晰的描述,為數(shù)字圖書館提供了一個(gè)統(tǒng)一框架、 規(guī)范模型,利用概念、屬性、 屬性與屬性之間的映射關(guān)系等對(duì)語義進(jìn)行描述,為語義理解與交流的可行性大大 加分。4、知識(shí)服務(wù)知識(shí)服務(wù),即以信息知識(shí)的搜尋、組織、分析的知識(shí)和能力為基礎(chǔ),根據(jù)用 戶的問題和環(huán)境,融入用戶解決問題的過程之中,提供能有效支持知識(shí)應(yīng)用和知 識(shí)創(chuàng)新的服務(wù)。目前,數(shù)字圖書館知識(shí)服務(wù)需要一個(gè)

22、新型的技術(shù)基礎(chǔ),支持?jǐn)?shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)、知識(shí)析取、知識(shí)應(yīng)用和智能化服務(wù)(智能Web服務(wù))。無疑,本體技術(shù)仰仗其豐富的語義和廣泛的關(guān)系, 是實(shí)現(xiàn)以上目標(biāo)的最佳手段,將本體 建設(shè)和相應(yīng)的代理引擎設(shè)計(jì)相結(jié)合即可解決問題。用DAML-S在服務(wù)模型基礎(chǔ)上定義流程模型本體,綜合人工智能規(guī)劃和工作流程研究成果,定義Web服務(wù)中的流程類型和流程控制等信息,可以較好的表示W(wǎng)eb服務(wù)自動(dòng)集成中的流程分類、合成、控制和時(shí)間約束等細(xì)節(jié)。5、自然語言理解本體是對(duì)世界知識(shí)概念化描述,它作為系統(tǒng)中的知識(shí)庫,是由概念集合以及 概念之間的關(guān)系所組成的計(jì)算實(shí)體。我們可以利用本體中所蘊(yùn)涵的世界知識(shí)中的 約束,結(jié)合語言知識(shí)可以進(jìn)行消

23、歧和推理。在系統(tǒng)中,歧義的產(chǎn)生主要源于兩方面:句法分析產(chǎn)生多種可能的句法分 析樹,即結(jié)構(gòu)歧義;詞匯對(duì)應(yīng)多個(gè)語義概念,即由多義詞產(chǎn)生的詞匯歧義。消11© 1 *>4-2010 China Academic Journal ElBttranic PuKlijihing House. Al rights reserved, http:歧就是在多個(gè)可能的意義中選擇最適合的意義,利用本體中的概念以及概念之間的約束關(guān)系進(jìn)行語義分歧的消除。 一般來說消歧可以有以下幾種手段:第一,利用句法信息,在分析及生成句法樹的同時(shí)檢查結(jié)構(gòu)是否符合詞匯的句法限制。第二,利用語義片斷組合過程來檢查語義限制。第

24、三,利用本體的結(jié)構(gòu)定義權(quán)重, 用語義描述的權(quán)值來消歧。由此可知,本體在自然語言理解領(lǐng)域中的作用:首先, 領(lǐng)域知識(shí)在釋疑中往往起到極為重要的作用,而領(lǐng)域本體則為領(lǐng)域知識(shí)的表示提 供了基礎(chǔ);其次,領(lǐng)域本體有助于識(shí)別不明確的語義分類,在此處本體又擔(dān)當(dāng)起了概念詞典的作用。2.1.5本體的集成本體集成的問題由歐洲委員會(huì)于2001年啟動(dòng)的 SWAP(Semantic Web andPeer-to-peer項(xiàng)目16發(fā)現(xiàn)。該項(xiàng)目需要一種能夠在每個(gè)終端構(gòu)建各自的本體之后 生成一個(gè)大本體的工具,因而發(fā)現(xiàn)了將多個(gè)不同團(tuán)隊(duì)構(gòu)建的多個(gè)小本體集成為一 個(gè)大本體時(shí)的本體映射和本體合并的問題 17。另外,由歐洲委員會(huì)資助的另

25、外 一個(gè)項(xiàng)目 SEKT(Semantically Enabled Knowledge technologies嚴(yán)也發(fā)現(xiàn)了本質(zhì)上 相同的問題,他們需要為使用多個(gè)不同本體的應(yīng)用找出這些本體之間的關(guān)系,實(shí)現(xiàn)本體之間的交互,以達(dá)成基于這些本體的數(shù)據(jù)間的重用和互操作19,稱其為本 體調(diào)解”(ontology mediation)在本體集成的研究過程中,美國(guó)斯坦福大學(xué)、德國(guó) 卡爾斯魯厄大學(xué)等一批頂尖本體研究機(jī)構(gòu)與知識(shí)網(wǎng)”(KnowledgeWeb, KW)2°等項(xiàng)目取得了大量的研究成果,處于國(guó)際領(lǐng)先水平。而在國(guó)內(nèi),本體集成還是一個(gè) 相對(duì)較新的研究領(lǐng)域,相關(guān)研究剛剛起步。其中,對(duì)于本體構(gòu)建工程的研

26、究集中 于本體的自動(dòng)構(gòu)建,也就是本體學(xué)習(xí)(ontology learning),孔敬21、杜小勇等人22 進(jìn)行了較為全面的綜述。本體維護(hù)工程,也就是本體生成之后使用過程中對(duì)本體 進(jìn)行修改使其進(jìn)化的工程,由于這一方面的研究在國(guó)際上也還沒有展開,所以馬文峰等人23只是簡(jiǎn)單的介紹了本體進(jìn)化的概念和研究前景。而對(duì)于本體集成工 程,目前還未見有研究綜述出現(xiàn)。1、本體集成的基本原則通過國(guó)內(nèi)外本體集成方法和過程的研究,本體集成應(yīng)該遵循以下四條基本原則:(1) 完備性原則。主要指語義完備性和約束完備性,待集成本體中如果有 語義或約束應(yīng)用需求,則該語義或約束一定要在目標(biāo)本體中有所體現(xiàn)。(2) 進(jìn)化原則。本體集成

27、同本體構(gòu)建一樣,是一個(gè)動(dòng)態(tài)過程,集成后的本 體一定要具有可復(fù)用性及二次開發(fā)的空間和能力。(3) 廣度與深度兼顧原則。即覆蓋程度和細(xì)化程度要求兩者兼顧。(4) 實(shí)用性原則。所謂實(shí)用性原則就是一方面要盡量減少人的工作量,另 一方面要考慮集成的復(fù)雜程度,當(dāng)將多個(gè)本體進(jìn)行集成所花費(fèi)的工作量及耗費(fèi)比12© 1 *>4-2010 Chirui Academic Journal Elec Iran ic PuKlijihing House. Al rights reserved, http: /'/wav .cnk i. iidt重新構(gòu)建一個(gè)新本體還要大的時(shí)候,就已經(jīng)無所謂集成了24

28、。2、本體集成的分類廣義上所說的本體集成,即本體融合(On tology Rec on ciliati on),指的是把多 個(gè)本體匯聚到一起使用,此時(shí)所涉及到的情況很多,本體集成也可廣義的分為如 下兩類:本體串聯(lián)(Ontology Aligning)和本體集成(Ontology Integrating)。本體串 聯(lián)是把兩個(gè)本體串在一起,建立相互之間的映射,但各自本體仍然獨(dú)立并且沒有 被改變。本體集成則是把兩個(gè)本體Oi和。2有機(jī)地結(jié)合在一起,產(chǎn)生新的一個(gè)本 體O和從實(shí)體Oi和O2到實(shí)體O的映射A*。狹義來講,按照集成程度的不同,本體集成可以分為本體映射(on tologymapping)、本體結(jié)

29、盟(ontology alignment)和本體合并(ontology merging)。上述 3 種形式的集成程度依次增強(qiáng),體現(xiàn)了從松散集成、封裝集成到緊密集成的過渡關(guān) 系25。按照本體語言的不同,本體集成可以分為本體概念層集成和本體語言層集 成。當(dāng)有兩個(gè)或多個(gè)本體庫描述的領(lǐng)域有交集時(shí),要對(duì)這些本體庫進(jìn)行集成,就必須解決概念層描述的差異。而當(dāng)語法存在差異以及表達(dá)能力上存在差異時(shí),即 需進(jìn)行本體語言層的集成26。2.2領(lǐng)域本體構(gòu)建研究根據(jù)前文所述,本體作為一種通用的知識(shí)共享模式,為特定領(lǐng)域的人和應(yīng)用 系統(tǒng)的交流提供極大的便利,也因?yàn)槿绱?,本體的研究和應(yīng)用迅速延伸到知識(shí)工 程、自然語言處理、信息

30、檢索系統(tǒng)、智能信息集成和知識(shí)管理、信息交換和軟件 工程等領(lǐng)域,而如何對(duì)這些不同領(lǐng)域內(nèi)的知識(shí)進(jìn)行抽取和描述并構(gòu)建出合適的領(lǐng) 域本體已成為目前的研究熱點(diǎn)之一。所謂的領(lǐng)域本體(domain-specific ontology)就是對(duì)學(xué)科概念的一種描述,包 括學(xué)科中的概念、概念的屬性、概念間的關(guān)系以及屬性和關(guān)系的約束27。由于知識(shí)具有顯著的領(lǐng)域特性,所以領(lǐng)域本體能夠更為合理而有效的進(jìn)行知識(shí)的表 示。領(lǐng)域本體可以表示某一特定領(lǐng)域范圍內(nèi)的特定知識(shí)。 這里的 領(lǐng)域”是根據(jù)本 體構(gòu)建者的需求來確立的,它可以是一個(gè)學(xué)科領(lǐng)域,可以是某幾個(gè)領(lǐng)域的一種結(jié) 合,也可以是一個(gè)領(lǐng)域中的一個(gè)小范圍。2.2.1領(lǐng)域本體的模型及

31、建模原語下面是一個(gè)用于領(lǐng)域知識(shí)表示的本體模型:領(lǐng)域本體是一個(gè)四元組O=C,l,R,Ax。其中:C是本體中的類集,I是類集C中的實(shí)例集,R是類集C上 的關(guān)系集合,類的繼承關(guān)系(is a)是最常見的類間關(guān)系,而 Ax是類間公理集合, 給出類集C的類之間屬性和關(guān)系的嚴(yán)格約束。13© 1 *>4-2010 Chirui Academic Journal Elec Iran ic PuKlijihing House. Al rights reserved, http: /'/wav .cnk i. iidt如果再把關(guān)系R詳細(xì)劃分為關(guān)系和函數(shù),就有了 Perez等人用分類法組織的

32、五元組本體:0=(C, R,F(xiàn),A,I),其中C、R、F、A和I分別是本體中概念、 關(guān)系、函數(shù)、公理和實(shí)例的集合,這五點(diǎn)也可以被稱為五個(gè)基本的建模原語。1、類(classes或概念(con cepts)概念(Concept)是一類對(duì)象的集合的抽象描述:C= O1,O2O n,其中Oi是領(lǐng)域中的對(duì)象。概念的含義很廣,可以表示任務(wù)、功能、行為、策略和推理過程等等。在實(shí)踐中,本體中的概念往往可以和類(Class)、類I(Category)、種類(Type) 通用。但是本體中的類與面向?qū)ο缶幊讨械念愂怯袇^(qū)別的, 兩者的重心不同,前 者關(guān)心類的結(jié)構(gòu)特征,而后者則關(guān)心類的操作特征。2、關(guān)系(Relatio

33、n)描述n個(gè)概念所含對(duì)象之間的聯(lián)系:0, C2Cn間的n元關(guān)系Rn:C1 x(c xxC是n個(gè)概念的笛卡兒乘積的任意子集。關(guān)系描述領(lǐng)域概念間的相互作用,基本的二元關(guān)系有4種:part-of,表示概念之間部分與整體的關(guān)系;kind-of,表示概念之間的繼承關(guān)系;instance-of表示 概念的實(shí)例與概念之間的關(guān)系;attribute-of示某個(gè)概念是另一個(gè)概念的屬性。在 實(shí)際建模中,概念之間的關(guān)系不限于這4種,可以根據(jù)領(lǐng)域的具體情況定義相應(yīng) 的關(guān)系,例如connect-to。在實(shí)踐中,本體中的關(guān)系往往可以和性質(zhì)(Property)、屬性(Attribute)、角色(Role),槽(Slot)通

34、用,例如在描述邏輯中稱為Role,而在基于框架的表示中稱為 Slot。3、函數(shù)(Fu nctio n)F: C1XCcX-X£-1Cn,函數(shù)是一類特殊的關(guān)系,其前 n-1個(gè)元素可以唯一 的確定第n個(gè)元素,如Mother-of就是一個(gè)函數(shù),mother-of(x,y)表示y是x的母 親。4、公理(Axiom)公理是無需證明的永真斷言。公理在本體中有兩個(gè)作用:嚴(yán)格定義概念和在 本體所表達(dá)的知識(shí)范圍內(nèi)回答問題。5、實(shí)例(In sta nce 或 In dividual)實(shí)例表示元素,即概念對(duì)應(yīng)的對(duì)象。一般認(rèn)為,類C是具有類似性質(zhì)的所有個(gè)體的抽象。在領(lǐng)域本體中,實(shí)例I和類C緊密相關(guān),是本體中

35、最基本最具體的對(duì)象,個(gè)體從屬于某個(gè)類就成為這 個(gè)類的一個(gè)實(shí)例。類有外延和內(nèi)涵兩個(gè)側(cè)面。外延指類所代表的個(gè)體的范圍,可 以認(rèn)為是類的所有實(shí)例構(gòu)成的集合;內(nèi)涵則是類的實(shí)例共同具有的所有性質(zhì)。某個(gè)個(gè)體是類的實(shí)例,當(dāng)且僅當(dāng)它具有內(nèi)涵中規(guī)定的所有性質(zhì);某種性質(zhì)在類的內(nèi)14© 1 *>4-2010 China Academic Journal ElBttranic PuKlijihing House. Al rights reserved, http:涵中,當(dāng)且僅當(dāng)類的所有實(shí)例都具有這種性質(zhì)。 本體中所有類和實(shí)例構(gòu)成本體的 論域。另外,在基于描述邏輯的本體中,公理A可以分為兩類:術(shù)語公理和

36、實(shí)例公理,實(shí)例公理對(duì)一個(gè)本體而言并非必需的,而術(shù)語公理則可以看成一類關(guān)系, 在實(shí)踐中往往定義為本體表示語言的描述符。 函數(shù)F和實(shí)例I不是必需的,可視 本體建模的詳盡程度而進(jìn)行取舍。222本體建模語言目前有很多種本體語言,但歸結(jié)起來大體可以分為兩大類型:基于AI的本體實(shí)現(xiàn)語言和基于 Web的本體標(biāo)記語言,以下我們將分別簡(jiǎn)要介紹。一、基于AI的本體描述語言1、KIFKIF ( Knowledge Interchange Forma)是由斯坦福大學(xué)開發(fā)的。斯坦福(Sta nford)大學(xué)知識(shí)系統(tǒng)實(shí)驗(yàn)室進(jìn)行了關(guān)于知識(shí)本體的研究,包括研究知識(shí)的 本質(zhì)特征和基本屬性。在這項(xiàng)研究中,D. Bobrow, R

37、. Brachman和V. Lifschitz等AI專家提出了這種稱為知識(shí)交換格式(knowledge interchange format,簡(jiǎn)稱 KIF)的知識(shí)描述語言,它的研究重點(diǎn)是語言的表達(dá)能力。它不同于KR系統(tǒng)間交換知識(shí)的格式,是一種基于一階邏輯的語言,特點(diǎn)是:它有公開的語義,不再 需要專門的解釋器;在邏輯上是全面的,可以對(duì)任意的邏輯語句進(jìn)行表達(dá); 可以 提供對(duì)元知識(shí)的表現(xiàn)。KIF和其它知識(shí)表示語言之間的區(qū)別在于它必須是和應(yīng)用完全無關(guān)的,另 外必須具有足夠的表達(dá)能力使得所有其它的知識(shí)表示語言都有轉(zhuǎn)換成KIF標(biāo)準(zhǔn)格式的可能2、OntolinguaOn toli ngua 是一種基于 KI

38、F( Kn owledge in tercha nge format),提供統(tǒng)一的規(guī) 范格式來構(gòu)建本體的語言。它可以用來定義對(duì)象、函數(shù)和關(guān)系。KIF擁有明確的語義,它是基于一階謂詞邏輯運(yùn)算的,并帶有注釋性的前綴。KIF還可以提供元知識(shí)的表示和非單調(diào)性的推理規(guī)則。KIF作為一種交互格式,從本質(zhì)上對(duì)本體進(jìn) 行了規(guī)定。但這種用KIF寫出來的有關(guān)本體的規(guī)范說明相當(dāng)乏味難懂。在Ontolingua中,定義本體是一種形式化和描述性的表示。它包含一個(gè)主體領(lǐng)域中 涉及到的詞匯(術(shù)語)以及描述這些詞匯是什么,之間如何相關(guān)和能否彼此相互 關(guān)聯(lián)的邏輯化的斷言。該語言支持 3種本體定義方式:(1)采用KIF表示;(2

39、)僅僅使用frame ontology的詞匯庫定義本體;(3)同時(shí)使用上述兩種表示 方式。Ontolingua包含KIF分析器、本體分析工具和一組 Ontolingua轉(zhuǎn)換器, 且獨(dú)立于特定表示系統(tǒng)的本體定義機(jī)制。其特點(diǎn)是:為構(gòu)造和維護(hù)本體,提供了統(tǒng)一的、計(jì)算機(jī)可讀的方式;由其構(gòu)造的本體可以方便的轉(zhuǎn)換到各種知識(shí)表示和15© 1 *>4-2010 Chirui Academic Journal Elec Iran ic PuKlijihing House. Al rights reserved, http: /'/wav .cnk i. iidt推理系統(tǒng)(Prolog、C

40、ORBA 的 IDL、CLIPS、LOOM、Epikit、Algernon 和 KIF), 從而將本體的維護(hù)與使用它的目標(biāo)系統(tǒng)分離;主要用于本體服務(wù)器(on tologyserver)。3、CycLCycL是Cyc系統(tǒng)的描述語言,本質(zhì)上是一階謂詞邏輯(FOPC)的一種擴(kuò)展。 它可以處理等詞、缺省推理、skolem化和其它一些二階特性,具有多種推理機(jī) 制(通用推理機(jī)制和特殊推理機(jī)制),命名唯一,且使用謂詞來表達(dá)概念之間的 關(guān)系,目前最多處理五元關(guān)系。CycL的特點(diǎn)是:在一階謂詞演算的基礎(chǔ)上擴(kuò)充了等價(jià)推理、缺省推理等功 能;具備二階謂詞演算的能力;其語言環(huán)境中配有功能很強(qiáng)的可進(jìn)行推理的推理 機(jī)。4

41、、LoomLoom是一種基于一階謂詞邏輯的知識(shí)表示語言,由美國(guó)南加洲大學(xué)信息科 學(xué)學(xué)院設(shè)計(jì)并實(shí)現(xiàn)。特點(diǎn)是:提供表達(dá)能力強(qiáng)、聲明性的規(guī)范說明語言;提供強(qiáng) 大的演繹推理能力,能供多種編程風(fēng)格和知識(shí)庫服務(wù)。該語言后來發(fā)展成為 PowerLoom語言。PowerLoom是KIF的變體,它是基于邏輯的,可以提供表達(dá) 能力強(qiáng)、聲明性的規(guī)范說明語言,也可以提供強(qiáng)大的演繹推理能力,采用前規(guī)則(backward and forward chaine)作為推理機(jī)制。5、FlogicFlogic(Frame Logic)由卡爾斯魯厄大學(xué)開發(fā),可以表示概念、概念分類、二 元關(guān)系、函數(shù)、實(shí)例、公理和規(guī)則。與上述幾種語言

42、相比,它是唯一沒有采用LISP 語法的語言。其推理引擎 OntoBr可以用來進(jìn)行約束檢查和演繹新知識(shí)。Flogic擁有一套模式理論的語義(A Model-theoretic Semantics)和一套完備的基于問題解 決方案的證明理論(Proof Theory)o FLogic軟件平臺(tái)從面向?qū)ο蟮难堇[型數(shù)據(jù)庫 (Deductive Databases發(fā)展成為本體,它可以融合其他的專門邏輯(如高階邏輯 HiLog、事務(wù)邏輯Transaction Logic。),并以此來改善本體中利用信息進(jìn)行推理 的功能。6描述邏輯描述邏輯(Description Logic)是基于對(duì)象的形式化知識(shí)表示方式,它吸

43、取了KL-ONE的主要思想,是一階謂詞邏輯的一個(gè)可判定子集。描述邏輯中的 描述”是指對(duì)一個(gè)領(lǐng)域知識(shí)采用描述的方式表達(dá),即利用概念和規(guī)則構(gòu)造符將原子概念 (一元謂詞)和原子規(guī)則(二元謂詞)構(gòu)建出描述表達(dá)式;邏輯”是指DL采用了正規(guī) 的基于邏輯的語義,這與語義網(wǎng)絡(luò)及框架等知識(shí)表示機(jī)制是不同的四。與一階謂詞邏輯所不同的是,描述邏輯系統(tǒng)能提供可判定的推理服務(wù)。在眾多知識(shí)表示的形式化方法中,描述邏輯在近年來頗受人們的關(guān)注,主要原因也在于強(qiáng)大的表16© 1 *>4-2010 China Academic Journal ElBttranic PuKlijihing House. Al ri

44、ghts reserved, http:達(dá)能力和清晰的模型理論機(jī)制,另外描述邏輯提供了很多推理服務(wù),成為眾多流 行化本體描述語言的基礎(chǔ)。描述邏輯的知識(shí)庫 K=<T, A>由Tbox(術(shù)語)和Abox(斷言(Assertoin)兩個(gè)部 分組成,其中Tbox是一個(gè)關(guān)于包含斷言的有限集合,有如下形式: C D,這里 C和D為概念。通常我們用CO作為C D和D C的縮寫。ABox是實(shí)例斷言 的有限集合,形式為c(a),其中c是一個(gè)概念,a是一個(gè)個(gè)體,或者形為P(a, b), 其中P為一個(gè)原始關(guān)系,a和b為兩個(gè)個(gè)體。一般地,描述邏輯依據(jù)提供的構(gòu)造 符,在簡(jiǎn)單的概念和關(guān)系上構(gòu)造出復(fù)雜的概念和關(guān)

45、系。通常描述邏輯至少包含以 下構(gòu)造符:交(G)、并(U)、非()、存在量詞()和全稱量詞(口),這種最基本的 描述的基礎(chǔ)上再添加不同的構(gòu)造符,則構(gòu)成不同的表達(dá)能力更強(qiáng)的描述邏輯。(1)描述邏輯的語法和語義表2.3中列出了描述邏輯的一般的語法和語義29:表2.3描述邏輯的一般語法及語義構(gòu)造苻的名稱構(gòu)造曲的語捷構(gòu)造符的不體縱釋TT通用類TJ =出丄空淇丄鼻0-.C原子否術(shù)舍取VAD図性值的束(VP.DY =aw M T0 w D,3ATWft存注妁康(3P.T)7|站"胡疋 嚴(yán)DJE-(nu£y 二 mur非限定性存在約束(3P.D)J 壬 W & I 站”捫 E 尸J

46、<nP 巔小數(shù)目灼束=口&|創(chuàng)3上比嚴(yán)藝町N廿(=nP)1 = <? e Ar | (tr,e F; J = «SnP最大皈目的束E“刊二佃e出|訕血時(shí)WD(2) 描述邏輯的推理功能描述邏輯的推理功能主要集中在以下兩個(gè)方面:包含(subsumption):即判斷一個(gè)概念是否為另一個(gè)概念的子集,主要用于概念的 自動(dòng)分類;可滿足性(satisfiability ):即判斷一個(gè)概念與己有的概念集(本體)是否相容,主要用 于概念集合的一致性檢測(cè)。(3) 描述邏輯的特征描述邏輯具有有很強(qiáng)的表達(dá)能力和可判定性,能夠保證算法在合適的地方準(zhǔn) 確的停止,且返回結(jié)果正確無誤,并可提供

47、有效的推理服務(wù)。描述邏輯的優(yōu)點(diǎn)17© 1*4-2010 China Academic Journal Electronic Publishing House. Al rigilts reserved.定義良好的語義和表達(dá)能力,清晰的模型一理論機(jī)制;具有很強(qiáng)的表達(dá)能力和可判定性;基于邏輯的推理能力,且提供了有效的推理算法,如著名的Tableaux的算法;推理工具的支持,如優(yōu)化的推理工具 FaCT、RACER等30。二、基于Web的本體描述語言1、RDF 和 RDF(S)RDF(資源描述框架,Resource Description Framework) RDF-S(RDF Schema

48、), 是W3C在XML的基礎(chǔ)上推薦的一種標(biāo)準(zhǔn),用于表示任何的資源信息。RDF模型的基礎(chǔ)要素是三種類型的對(duì)象:(1)資源(resources,標(biāo)識(shí)實(shí)際的以網(wǎng)絡(luò) 為基礎(chǔ)的資源,比如網(wǎng)頁和網(wǎng)絡(luò)應(yīng)用程序。統(tǒng)一資源標(biāo)識(shí)符(URI)可用來標(biāo)識(shí)資源,每一個(gè)URI指向一個(gè)特定的網(wǎng)頁或網(wǎng)絡(luò)應(yīng)用程序。(2)屬性(properties), 指定特定資源的屬性或特性。(3)聲明(stateme nts是資源和屬性的下一級(jí)延伸, 其作用是在一項(xiàng)特定的資源中為屬性分配屬性值。每個(gè)RDF聲明都用XML來表述。RDF的數(shù)據(jù)模型實(shí)質(zhì)上是一種二元關(guān)系的表達(dá),由于任何復(fù)雜的關(guān)系都 可以分解為多個(gè)簡(jiǎn)單的二元關(guān)系,因此 RDF的數(shù)據(jù)模

49、型可以作為其它任何復(fù)雜 關(guān)系模型的基礎(chǔ)模型。RDF具有通用性,并不限定于某個(gè)領(lǐng)域的網(wǎng)絡(luò)資源定義, 而它所描述的網(wǎng)絡(luò)資源也可以是任意格式的,既可以是XML格式的,也可以不是。總之,RDF是W3C提出的一種知識(shí)表示模型,它希望支持網(wǎng)絡(luò)上的知識(shí)共 享(sharing)與知識(shí)交換(Exchange)。RDF Schema則為RDF資源的屬性和類型提供定義良好的詞匯表。RDFS是一種用于定義 RDF schemas的聲明語言(Declarative Language)b RDFS的數(shù)據(jù)模 型(DM Data Model)是基于框架的(Frames-based)它為定義屬性與資源之間 的關(guān)系提供了機(jī)制,核

50、心的概念/類(Core classes是類、資源和屬性。RDF Schema 定義了一個(gè)類型系統(tǒng)(Type System),它與其他類型系統(tǒng)的區(qū)別在于對(duì) 類”的定 義,其他系統(tǒng)通過類的屬性來定義類,而RDF Schema通過從屬于哪些類的資源 來定義屬性。2、OILOIL是一種針對(duì)ontology的基于互聯(lián)網(wǎng)的表現(xiàn)和推理層。OIL以RDF Schema 為起點(diǎn),用更為豐富的本體建模原語對(duì) RDF Schema進(jìn)行擴(kuò)充,把基于框架表示 的方法應(yīng)用于建?;?,實(shí)現(xiàn)了由描述邏輯來刻畫形式化的語義并以此為系統(tǒng)提 供有效的推理支持。OIL將框架系統(tǒng)、描述邏輯和 Web標(biāo)準(zhǔn)(XML和RDF)這 三個(gè)不同領(lǐng)

51、域的優(yōu)點(diǎn)結(jié)合起來,這三個(gè)領(lǐng)域的工作分別是:(1)基于框架的系統(tǒng):基于框架的語言的中心建模原語是類(稱作框架)和屬性(稱為槽)。(2)描述邏輯(DL):描述邏輯通過概念(對(duì)應(yīng)于類或者框架)和角色(對(duì)應(yīng)于槽) 描述知識(shí)。DL的一個(gè)重要特征是它們具有良好的理解理論性質(zhì),并且在DL中18 © 1 *>4-2010 China Academic Journal ElBttranic PuKlijihing House. Al rights reserved, http:任何表達(dá)的含義都可以通過數(shù)學(xué)的精確的方式描述, 而OIL就是從DL中繼承了 形式化語義和有效的推理支持。(3)互聯(lián)網(wǎng)標(biāo)準(zhǔn)

52、:這里指的是 XML和RDF, OIL標(biāo)記語言的語法均源自 W3C的這些標(biāo)準(zhǔn)。一個(gè)OIL 本體用關(guān)鍵字begin-ontology 和end-ontology來描述,其中包 括on tology con tai ner和實(shí)際的本體定義兩大部分構(gòu)成。von tology>:=beg in-on tology<container>vdefi niti ons>end-on tology3、SHOESHOE (簡(jiǎn)單HTML本體擴(kuò)展)是一種可以內(nèi)嵌入 web頁面的基于本體的 知識(shí)表示語言。SHOE語言的簡(jiǎn)單性是它的長(zhǎng)處,SHOE本體可以讓大眾在 web 頁面上定位它們,可以建立

53、/擴(kuò)展本體,而本體交互所能達(dá)到的程度是:可共享 同一祖先本體。如前所述,SHOE是基于HTML的Web上的知識(shí)表示語言,具 有XML兼容性。SHOE實(shí)際上是HTML的擴(kuò)展集。它的開發(fā)首要是為了擴(kuò)展 HTML,然后是在HTML或者其它Web文檔中合并機(jī)器可讀的語義知識(shí)。 最近, 研究人員又對(duì)SHOE進(jìn)行了調(diào)整,使之更適應(yīng)于 XML。SHOE的目的在于使代 理可以收集網(wǎng)頁上、文檔中的有用信息,改進(jìn)搜索機(jī)制和知識(shí)收集。SHOE有三種類型的推理子從句:分類、關(guān)系和比較。它通過建立邏輯,將數(shù)據(jù)和本體分離開來,允許本體在數(shù)據(jù)層面上提供不同視圖。通過映射SHOE到這個(gè)邏輯可展示一個(gè)本體修訂的不同類型是怎樣影

54、響已存在的數(shù)據(jù)源的。另外要注意的是增加分類或關(guān)系的修訂不會(huì)產(chǎn)生什么影響,而修改規(guī)則的修訂會(huì)改變查詢結(jié)果以及刪除分類或關(guān)系的修訂可能消除確定的答案。4、XOLXOL(Ontology Exchange Language)是 SRI International 的人工智能中心(AIC)開發(fā)的。它是一種簡(jiǎn)單通用的定義本體的方法, 以O(shè)ntolingua和XML(本 體標(biāo)記語言)為基礎(chǔ),融合了 OKBC的高層表達(dá)方式和OML語法。其目的是在 不同的數(shù)據(jù)庫、本體開發(fā)工具、或者其它應(yīng)用程序之間交換本體。XOL設(shè)計(jì)之初是為生物信息學(xué)領(lǐng)域本體的交換,但是它可以應(yīng)用于各種領(lǐng)域。目前沒有支持 XOL本體開發(fā)的工具

55、,但由于它采用 XML語法,所以可以采用XML編輯器創(chuàng) 建XOL文件。XOL基本上不用于本體開發(fā),但是可以在不同的數(shù)據(jù)庫系統(tǒng)間、 不同的本體開發(fā)工具間或應(yīng)用程序間作為本體傳遞的中介語言。5、OWL19© 1 *>4-2010 Chirui Academic Journal Elec Iran ic PuKlijihing House. Al rights reserved, http: /'/wav .cnk i. iidtOWL (Web Ontology Language)位于 W3C 繪制的 ontology 語言棧的棧頂,應(yīng)用中不僅僅需要提供給用戶可讀的文檔內(nèi)容

56、,而且希望處理文檔內(nèi)容信息。OWL能夠被用于清晰地表達(dá)詞匯表中的詞條(term)的含義以及這些詞條之間 的關(guān)系。由于OWL擁有更多的機(jī)制來表達(dá)語義,從而超越了 XML、RDF和RDF Schema僅能表達(dá)網(wǎng)上機(jī)器可讀的文檔內(nèi)容的能力。圖2.1 ontology語言棧(1)OWL子語言O(shè)WL提供了三種表達(dá)能力遞增的子語言 OWL Lite、OWL DL和OWL Full, 分別用于特定的用戶群體。OWL Lite用于提供給那些只需要一個(gè)分類層次和簡(jiǎn)單約束的用戶。例如, 雖然OWL Lite支持基數(shù)限制,但只允許基數(shù)為0或1。提供支持OWL Lite的工 具應(yīng)該比支持其他表達(dá)能力更強(qiáng)的 OWL子語

57、言更簡(jiǎn)單,并且從辭典(thesuari)和 分類系統(tǒng)(taxonomy)轉(zhuǎn)換到OWLLite更為迅速。相比 OWL DL,OWL Lite還具 有更低的形式復(fù)雜度。OWL DL用于支持強(qiáng)表達(dá)能力的同時(shí)需要保持計(jì)算的完備性(computati noalcompleteness,即所有的結(jié)論都能夠確保被計(jì)算出來)和可判定性(decidbaility,即 所有的計(jì)算都能在有限的時(shí)間內(nèi)完成)的知識(shí)表示。OWL DL包括了 OWL語言 的所有語言成分,但使用時(shí)必須符合一定的約束,例如,一個(gè)類可以是多個(gè)類的 子類,但它不能同時(shí)是另外一個(gè)類的實(shí)例。OWL DL的命名起因于它對(duì)應(yīng)于描述 邏輯,這是一個(gè)研究作為 OWL形式基礎(chǔ)的邏輯的研究領(lǐng)域。OWL Full支持最

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論