本體理論與領(lǐng)域本體的構(gòu)建_第1頁
本體理論與領(lǐng)域本體的構(gòu)建_第2頁
本體理論與領(lǐng)域本體的構(gòu)建_第3頁
本體理論與領(lǐng)域本體的構(gòu)建_第4頁
本體理論與領(lǐng)域本體的構(gòu)建_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第二章 本體理論與領(lǐng)域本體的構(gòu)建2.1本體理論2.1.1 本體的基本概念本體論(Ontology)的概念最初起源于哲學領(lǐng)域,是形而上學理論研究的一 個分支,與認識論相對。認識論研究人類知識的本質(zhì)和來源,即研究主觀認知, 而本體論研究的則是客觀存在。Ontology 一方面研究存在的本質(zhì),另一方面研究 客體對象的理論定義,即整個現(xiàn)實世界的基本特征。現(xiàn)在哲學領(lǐng)域較多翻譯為本 體論”經(jīng)過多年的演進,到今天,經(jīng)過人們對本體”這一概念的重新理解和定位,本體的理論與方法早已被信息領(lǐng)域采用,用于知識的組織、表示、共享和重 用。本體在計算機學科的使用可以追溯到上個世紀80年代,Alxenader在1986年發(fā)

2、表的文章被視為本體在計算機領(lǐng)域獲得不同于哲學領(lǐng)域的新的研究的起點。 隨后Ontolgoy在人工智能領(lǐng)域界獲得穩(wěn)步的發(fā)展,并被逐漸賦予了新的含義8-9。 1991年,在人工智能領(lǐng)域,Neches等人最早給出Ontology定義,Neches認為10“ An ontology defines the basic terms and relations comprising the vocabulary of a topic area,as well as the rules for combining termsand relations to define extensions to the v

3、ocabulary.即一個本體給出構(gòu)成相關(guān)領(lǐng)域詞匯的基本術(shù)語和關(guān)系,以及利用 這些術(shù)語和關(guān)系構(gòu)成的規(guī)則定義這些詞匯的外延規(guī)則?!北倔w定義了組成主題領(lǐng)域的詞匯表的基本術(shù)語及其關(guān)系,以及結(jié)合這些術(shù)語和關(guān)系來定義詞匯表外延的 規(guī)則11 。 1993年美國斯坦福大學知識系統(tǒng)實驗室(Knowledge System Laborary, 簡稱KSL)的Gruber給出了本體在信息科學領(lǐng)域被廣泛接受的定義:“An ontologyis an explicit specification of a conceptualization 12。即 本體是概念化的明確的規(guī) 范化說明”這也是最著名并被引用最為廣泛的定

4、義。1995年Guarino和Giaretta 將本體定義為13本體是概念化的明確部分的說明一種邏輯語言的模型?!边@個定義與Gruber的理解有異曲同工之妙。隨后在1997年W.N.Borst對Gruber的定 義進行了引申,提出了 本體是共享概念模型的形式化規(guī)范說明 ”以及1998年 J.Studer的 本體是共享概念模型的明確的形式化的規(guī)范說明”本體的定義隨著時間的推移也在進行著不斷的變化發(fā)展,為明確起見,現(xiàn)將 本體發(fā)展史中較有代表性的定義列表如下:表2.1本體發(fā)展史中的定義列表時間/提出人定義1991/Neches一個本體給出構(gòu)成相關(guān)領(lǐng)域詞匯的基本術(shù)語 和關(guān)系,以及利用這些術(shù)語和關(guān)系構(gòu)成

5、的規(guī)© 1 *>4-2010 Chirui Academic Journal Ekctronic PuKlijihing House. All rights reserved, http:/'/wavi. Jidt則定義這些詞匯的外延規(guī)則1993/Gruber本體是概念化的明確的規(guī)范化說明1995/Guarino 和 Giaretta本體是概念化的明確部分的說明一種邏輯語言的模型1996/ Bernaras 等本體提供了一種用來顯式地描述概念化的方式1997/W.N.Borst本體是共享概念模型的形式化規(guī)范說明1997/ Swartout本體是一個為描述某個領(lǐng)域而按繼承

6、關(guān)系組織起來作為一個知識庫骨架的一系列術(shù)語1998/J.Studer本體是共享概念模型的明確的形式化的規(guī)范說明2000/ Fen sel本體是對一個特定領(lǐng)域中重要概念的共享形式化的描述2001/ Noy F.N.本體是對某個領(lǐng)域中的概念形式化的明確表示,每個概念的特性描述了這個概念的各個方面及其約束的特征和屬性2002/Fonseca本體是以某一觀點用詳細明確的詞匯表描述 實體,概念,特性和相關(guān)功能的理論2003/Starlab本體必需包括所使用術(shù)語的規(guī)范說明,決定 這些術(shù)語含義的協(xié)議,以及術(shù)語之間的聯(lián)系, 來表達概念由上述列表可見,人們對本體的定義和理解是有一個逐步認識的過程的。盡 管本體的

7、定義有很多不同的方式和不同的側(cè)重點,但從內(nèi)涵上來講,本體的概念有下面四層含義:概念化(conceputalization):通過抽象出客觀世界中一些現(xiàn)象(phenomenon的相 關(guān)概念而得到的模型,其表示的含義獨立于具體的環(huán)境狀態(tài)。 明確(explicit):概念與概念之間的聯(lián)系及使用這些概念的約束都被明確定義。(3) 形式化(formal):有精確的數(shù)學描述,是計算機可讀的。共享(Share):本體中體現(xiàn)的是共同認可的知識,反映的是相關(guān)領(lǐng)域中公認的 概念集,它所針對的是團體而不是個體14。可見這些不同的研究者雖然各執(zhí)己見,但對本體的內(nèi)涵卻認識一致,都把本 體當作某個領(lǐng)域內(nèi)不同主體(人、代理

8、、機器等)之間進行交流(對話、互操作、 共享等)的語義基礎。其實,本體就是通過對于概念、術(shù)語及其相互關(guān)系的規(guī)范 化描述,勾畫出某一領(lǐng)域的基本知識和描述語言,是一個已經(jīng)得到公認的形式化 的知識表示體系,包含詞表(或名稱表/術(shù)語表),詞表中的術(shù)語全是與某一專業(yè)領(lǐng)7© 1 *>4-2010 China Academic Journal Electronic Publijihing House. All rights reserved,http:/'/ki.iidt域相關(guān)的,而邏輯聲明全部用來描述術(shù)語的含義及關(guān)系。2.1.2本體的分類1、按照領(lǐng)域依賴程度:(1)頂層

9、(top-level)本體:描述的是最普通的概念及概念之間的關(guān)系,如空 間、時間、事件、行為等,完全獨立于特定的問題和領(lǐng)域,其他本體都是該類本 體的特例。(2)領(lǐng)域(domain)本體:描述的是特定領(lǐng)域(醫(yī)學、地理等)中的概念及概念 之間的關(guān)系。(3)任務(task)本體:描述的是特定任務或行為中的概念及概念之間的關(guān) 系。(4)應用(application)本體:描述的是依賴于特定領(lǐng)域和任務的概念及概念 之間的關(guān)系。在這個分類當中,領(lǐng)域本體和任務本體是處于同一個研發(fā)層次的,它們都能應用頂層本體中定義的詞匯來描述自己的詞匯。應用本體既能應用領(lǐng)域本體中的概念,也能引用任務本體中的詞匯。2、按照細化

10、程度Guari no從兩種不同的維度對本體進行劃分。除了依據(jù)對領(lǐng)域的依賴程度分 類,還提出了以詳細程度分類。詳細程度是相對的、模糊的一個概念,是描述或 刻畫建模對象的程度。參考(refere nee本體:詳細程度高。共享(shareable本體:詳細程度低。3、按照形式化程度(1)高度非形式化:用自然語言松散表示。(2)結(jié)構(gòu)非形式化:用限制的結(jié)構(gòu)化的自然語言表示。(3)半形式記:用半形式化(人工定義的)語言表示。(4) 嚴格形式化:所有術(shù)語都具有形式化的語義,能在某種程度上證明完 全性和合理性。4、按照是否具備推理功能(1)輕量級本體(Lightweight ontology):輕量級本體不具

11、備邏輯推理功能, 例如敘詞表和WordNet。(2)中級本體(Middle ontology):中級本體具有簡單的邏輯推理功能,系統(tǒng) 可以識別一階謂詞邏輯的表達式。(3)重量級本體(Heavyweight。ntology):重量級本體具有復雜的邏輯推理功能,系統(tǒng)可以識別更加復雜的二階謂詞邏輯的表達式,并為更加復雜的推理功能的實現(xiàn)預留了接口,女口 Cyc本體系統(tǒng)I9】。8© 1 *>4-2010 Chirui Academic Journal Elec Iran ic PuKlijihing House. Al rights reserved, http: /'/wav

12、.cnk i. iidt5、按本體描述對象的不同,Uschold把本體分為特殊領(lǐng)域本體(如醫(yī)藥、地 理、金融等)、一般世界知識本體、問題求解本體和知識表示語言本體等。6按不同的研究主題15:(1) 知識表示本體(Knowledge Representation ontologies)如 Frame Ontology和斯坦福大學知識系統(tǒng)實驗室提出的知識描述語言KIF(K nowledge In tercha ngeFormat)。(2) 通用或常識本體(General/Common ontologies,女口 Cyc本體系統(tǒng)。到 2000年為止,Cyc的常識庫已有了 1,600,000條知識和幾

13、百個微理論 (micro-theory)。(3) 領(lǐng)域本體(Domain ontologies),如基因本體 GO(Gene ontologies)愛丁 堡大學企業(yè)本體。(4) 語言學本體(linguistic ontologies),關(guān)于語言、詞匯等的本體,典型實 例有 GUM(Generalized Upper Model),WordNet 和 MindNet 等。(5) 任務本體(Task ontologies),主要研究如 Chandrasekaran等人的關(guān)于任 務和問題求解方法本體的研究。除了上述幾種分類方法外,1999年,Perez和Benjamins在分析和研究了各 種本體分類

14、法的基礎上,歸納出10種本體:知識表示本體、常識本體、頂級本體、元(核心)本體、領(lǐng)域本體、語一言本體、任務本體、領(lǐng)域一任務本體、方法 本體和應用本體。這種分類法是對 Guarino提出的分類方法的擴充和細化,但是 這10種本體之間存在交叉,層次不夠清晰。2.1.3本體的功能與作用1、本體為人和主體之間的溝通和交流提供了共享的基礎,也方便了不同領(lǐng) 域的系統(tǒng)開發(fā)人員和研究人員之間的溝通,它是人機在語義上交互的最好的基 礎。而開發(fā)領(lǐng)域本體的主要目的之一就是在人們和軟件智能之間對信息結(jié)構(gòu)的理 解提供一種可共享的、共同的理解機制。2、本體支持對于知識的重用。本體提供了獨立于應用的描述方法使之可在 不同系

15、統(tǒng)間重用。例如在基于構(gòu)件的軟件開發(fā)過程中,開發(fā)知識系統(tǒng)時知識工程 師可以將本體論概念引入知識工程,詳細說明模型中的概念、實例、關(guān)系和公理 等實體,并以此建立領(lǐng)域本體。然后針對屬性提出本體建模概念化分析的形式化 方法,解決知識共享中的問題。此舉有效的提高了工作效率,促進了來自不同領(lǐng) 域的研究人員和組織間的交流。3、本體提供了一種結(jié)構(gòu)化的表示領(lǐng)域知識的形式化方法。在本體中,明確說明了領(lǐng)域概念及概念之間的關(guān)系,并且支持對領(lǐng)域規(guī)則的描述,是領(lǐng)域知識的形式化表示。4、知識本體可以明確領(lǐng)域假設,使領(lǐng)域公理得到明確描述從而達成共知。9© 1 *>4-2010 China Academic J

16、ournal ElBttranic PuKlijihing House. Al rights reserved, http:5、本體有助于知識的標準化。本體為人們描述目標世界提供了一組通用詞 匯,而這種通用的詞匯正是實現(xiàn)知識系統(tǒng)化的基礎。 通用詞匯和知識的系統(tǒng)化有 利于實現(xiàn)知識的標準化。2.1.4本體的應用目前本體已經(jīng)廣泛應用于人工智能、知識工程及其相關(guān)領(lǐng)域。本體的功能及 其應用領(lǐng)域大致可以概括為三類:作為知識表示方法,應用于知識工程和知識管 理;作為系統(tǒng)分析方法,應用于信息建模、面向?qū)ο蠓治龊蛿?shù)據(jù)庫設計;作為信 息語義的形式化表示方法,應用于異構(gòu)信息集成、多智能體系統(tǒng)、語義Web等。具體來說

17、可以分為以下幾個方面:1、信息檢索本體具有的良好的概念層次結(jié)構(gòu)和對邏輯推理的支持,因而在信息檢索,特 別是在基于知識的檢索中得到了廣泛的應用?;诒倔w的信息檢索的基本設計思 想可以總結(jié)如下:(1)在領(lǐng)域?qū)<业膸椭?,建立相關(guān)領(lǐng)域的本體;(2)收集信息源中的數(shù)據(jù),并參照已建立的本體把收集來的數(shù)據(jù)按規(guī)定格式存 儲在元數(shù)據(jù)庫(RDB(關(guān)系數(shù)據(jù)庫),KDB(知識數(shù)據(jù)庫)等)中;(3)對用戶檢索界面獲取的查詢請求,查詢轉(zhuǎn)換器按照本體把查詢請求轉(zhuǎn)換成規(guī)定的格式,在本體的幫助下從元數(shù)據(jù)庫中匹配出符合條件的數(shù)據(jù)集合,檢索的結(jié)果經(jīng)過定制處理返回給用戶。表2.2本體應用于信息檢索的項目項目說明2(Onto) Ag

18、e nt幫助用戶檢索所要的 www上已有的Ontology,主要采用參照 Ontology, 即以www上已有的Ontology為對象建立起來的 Ontology,保存各類Ontology的元數(shù)據(jù)。On tobroker面向www上的網(wǎng)頁資源,目的是幫助用戶檢索所需的網(wǎng)頁,這些網(wǎng)頁含有用戶關(guān)心的內(nèi)容。SKC解決信息系統(tǒng)語義異構(gòu)問題,實現(xiàn)異構(gòu)自治系統(tǒng)間的互操作,通過在Ontology上的一個代數(shù)系統(tǒng)來實現(xiàn)Ontology之間的互操作,實現(xiàn)異構(gòu)系統(tǒng)之間的互操作。2、電子商務電子商務的出現(xiàn),為來自不同領(lǐng)域、不同地區(qū)甚至不同國家的商業(yè)伙伴之間 進行交易提供了更為方便快捷的商務平臺,因此受到了企業(yè)和商家

19、越來越多的重 視。但由此而來的電子商務交易方的大量產(chǎn)品描述、目錄和文檔,以及亟待解決的異構(gòu)問題成為B2B電子商務發(fā)展的瓶頸所在。10© 1 *>4-2010 Chirui Academic Journal Ekctronic PuKlijihing House. All rights reserved, http:/'/wavi. Jidt本體在B2B的通信中可以起到信息集成的作用,它將信息的表示分為三個 層次:語法層、數(shù)據(jù)模型層和本體層,其中語法層與使用XML序列化表示的文檔實例相對應;數(shù)據(jù)模型層將語法層中的差異抽取出來進行統(tǒng)一表示,并用對象-屬性-值的形式對產(chǎn)品進行

20、描述;而本體層則定義不同產(chǎn)品和文檔標準提供的 各種信息的術(shù)語,有效地幫助其完成 Web數(shù)據(jù)的語義處理和管理。3、數(shù)字圖書館數(shù)字圖書館是社會信息基礎結(jié)構(gòu)中信息資源管理、 存儲和傳輸?shù)幕窘M織形 式,擁有豐富的超容量多媒體介質(zhì)的數(shù)字化信息資源,依托網(wǎng)絡為信息需求者提 供快捷高效的數(shù)字化圖書館信息服務。但各類信息常在具體系統(tǒng)條件限制下用專 門語言定義組織為內(nèi)部結(jié)構(gòu)和格式, 難以有效進行機器支持的檢索、 解析、處理 和交換,更不要說進行跨文獻單元、數(shù)據(jù)類型、數(shù)據(jù)層次和系統(tǒng)范圍的信息挖掘、 抽取、綜合分析描述、轉(zhuǎn)換了。本體的出現(xiàn)就極大的解決了語義知識缺乏的問題, 為XML與RDF等技術(shù)提供語義支持。在進

21、行信息資源整合時,本體可以靈活 處理各類信息資源,有效識別信息資源的類型,提供資源庫領(lǐng)域知識的規(guī)范描述, 提供元數(shù)據(jù)映射方案,為智能代理與信息環(huán)境之間提供基于語義的理解機制,此外還可作為跨平臺、跨系統(tǒng)之間的通信中介存在,為揭示知識間的語義關(guān)系提供 了清晰的描述,為數(shù)字圖書館提供了一個統(tǒng)一框架、 規(guī)范模型,利用概念、屬性、 屬性與屬性之間的映射關(guān)系等對語義進行描述,為語義理解與交流的可行性大大 加分。4、知識服務知識服務,即以信息知識的搜尋、組織、分析的知識和能力為基礎,根據(jù)用 戶的問題和環(huán)境,融入用戶解決問題的過程之中,提供能有效支持知識應用和知 識創(chuàng)新的服務。目前,數(shù)字圖書館知識服務需要一個

22、新型的技術(shù)基礎,支持數(shù)據(jù)挖掘、知識發(fā)現(xiàn)、知識析取、知識應用和智能化服務(智能Web服務)。無疑,本體技術(shù)仰仗其豐富的語義和廣泛的關(guān)系, 是實現(xiàn)以上目標的最佳手段,將本體 建設和相應的代理引擎設計相結(jié)合即可解決問題。用DAML-S在服務模型基礎上定義流程模型本體,綜合人工智能規(guī)劃和工作流程研究成果,定義Web服務中的流程類型和流程控制等信息,可以較好的表示W(wǎng)eb服務自動集成中的流程分類、合成、控制和時間約束等細節(jié)。5、自然語言理解本體是對世界知識概念化描述,它作為系統(tǒng)中的知識庫,是由概念集合以及 概念之間的關(guān)系所組成的計算實體。我們可以利用本體中所蘊涵的世界知識中的 約束,結(jié)合語言知識可以進行消

23、歧和推理。在系統(tǒng)中,歧義的產(chǎn)生主要源于兩方面:句法分析產(chǎn)生多種可能的句法分 析樹,即結(jié)構(gòu)歧義;詞匯對應多個語義概念,即由多義詞產(chǎn)生的詞匯歧義。消11© 1 *>4-2010 China Academic Journal ElBttranic PuKlijihing House. Al rights reserved, http:歧就是在多個可能的意義中選擇最適合的意義,利用本體中的概念以及概念之間的約束關(guān)系進行語義分歧的消除。 一般來說消歧可以有以下幾種手段:第一,利用句法信息,在分析及生成句法樹的同時檢查結(jié)構(gòu)是否符合詞匯的句法限制。第二,利用語義片斷組合過程來檢查語義限制。第

24、三,利用本體的結(jié)構(gòu)定義權(quán)重, 用語義描述的權(quán)值來消歧。由此可知,本體在自然語言理解領(lǐng)域中的作用:首先, 領(lǐng)域知識在釋疑中往往起到極為重要的作用,而領(lǐng)域本體則為領(lǐng)域知識的表示提 供了基礎;其次,領(lǐng)域本體有助于識別不明確的語義分類,在此處本體又擔當起了概念詞典的作用。2.1.5本體的集成本體集成的問題由歐洲委員會于2001年啟動的 SWAP(Semantic Web andPeer-to-peer項目16發(fā)現(xiàn)。該項目需要一種能夠在每個終端構(gòu)建各自的本體之后 生成一個大本體的工具,因而發(fā)現(xiàn)了將多個不同團隊構(gòu)建的多個小本體集成為一 個大本體時的本體映射和本體合并的問題 17。另外,由歐洲委員會資助的另

25、外 一個項目 SEKT(Semantically Enabled Knowledge technologies嚴也發(fā)現(xiàn)了本質(zhì)上 相同的問題,他們需要為使用多個不同本體的應用找出這些本體之間的關(guān)系,實現(xiàn)本體之間的交互,以達成基于這些本體的數(shù)據(jù)間的重用和互操作19,稱其為本 體調(diào)解”(ontology mediation)在本體集成的研究過程中,美國斯坦福大學、德國 卡爾斯魯厄大學等一批頂尖本體研究機構(gòu)與知識網(wǎng)”(KnowledgeWeb, KW)2°等項目取得了大量的研究成果,處于國際領(lǐng)先水平。而在國內(nèi),本體集成還是一個 相對較新的研究領(lǐng)域,相關(guān)研究剛剛起步。其中,對于本體構(gòu)建工程的研

26、究集中 于本體的自動構(gòu)建,也就是本體學習(ontology learning),孔敬21、杜小勇等人22 進行了較為全面的綜述。本體維護工程,也就是本體生成之后使用過程中對本體 進行修改使其進化的工程,由于這一方面的研究在國際上也還沒有展開,所以馬文峰等人23只是簡單的介紹了本體進化的概念和研究前景。而對于本體集成工 程,目前還未見有研究綜述出現(xiàn)。1、本體集成的基本原則通過國內(nèi)外本體集成方法和過程的研究,本體集成應該遵循以下四條基本原則:(1) 完備性原則。主要指語義完備性和約束完備性,待集成本體中如果有 語義或約束應用需求,則該語義或約束一定要在目標本體中有所體現(xiàn)。(2) 進化原則。本體集成

27、同本體構(gòu)建一樣,是一個動態(tài)過程,集成后的本 體一定要具有可復用性及二次開發(fā)的空間和能力。(3) 廣度與深度兼顧原則。即覆蓋程度和細化程度要求兩者兼顧。(4) 實用性原則。所謂實用性原則就是一方面要盡量減少人的工作量,另 一方面要考慮集成的復雜程度,當將多個本體進行集成所花費的工作量及耗費比12© 1 *>4-2010 Chirui Academic Journal Elec Iran ic PuKlijihing House. Al rights reserved, http: /'/wav .cnk i. iidt重新構(gòu)建一個新本體還要大的時候,就已經(jīng)無所謂集成了24

28、。2、本體集成的分類廣義上所說的本體集成,即本體融合(On tology Rec on ciliati on),指的是把多 個本體匯聚到一起使用,此時所涉及到的情況很多,本體集成也可廣義的分為如 下兩類:本體串聯(lián)(Ontology Aligning)和本體集成(Ontology Integrating)。本體串 聯(lián)是把兩個本體串在一起,建立相互之間的映射,但各自本體仍然獨立并且沒有 被改變。本體集成則是把兩個本體Oi和。2有機地結(jié)合在一起,產(chǎn)生新的一個本 體O和從實體Oi和O2到實體O的映射A*。狹義來講,按照集成程度的不同,本體集成可以分為本體映射(on tologymapping)、本體結(jié)

29、盟(ontology alignment)和本體合并(ontology merging)。上述 3 種形式的集成程度依次增強,體現(xiàn)了從松散集成、封裝集成到緊密集成的過渡關(guān) 系25。按照本體語言的不同,本體集成可以分為本體概念層集成和本體語言層集 成。當有兩個或多個本體庫描述的領(lǐng)域有交集時,要對這些本體庫進行集成,就必須解決概念層描述的差異。而當語法存在差異以及表達能力上存在差異時,即 需進行本體語言層的集成26。2.2領(lǐng)域本體構(gòu)建研究根據(jù)前文所述,本體作為一種通用的知識共享模式,為特定領(lǐng)域的人和應用 系統(tǒng)的交流提供極大的便利,也因為如此,本體的研究和應用迅速延伸到知識工 程、自然語言處理、信息

30、檢索系統(tǒng)、智能信息集成和知識管理、信息交換和軟件 工程等領(lǐng)域,而如何對這些不同領(lǐng)域內(nèi)的知識進行抽取和描述并構(gòu)建出合適的領(lǐng) 域本體已成為目前的研究熱點之一。所謂的領(lǐng)域本體(domain-specific ontology)就是對學科概念的一種描述,包 括學科中的概念、概念的屬性、概念間的關(guān)系以及屬性和關(guān)系的約束27。由于知識具有顯著的領(lǐng)域特性,所以領(lǐng)域本體能夠更為合理而有效的進行知識的表 示。領(lǐng)域本體可以表示某一特定領(lǐng)域范圍內(nèi)的特定知識。 這里的 領(lǐng)域”是根據(jù)本 體構(gòu)建者的需求來確立的,它可以是一個學科領(lǐng)域,可以是某幾個領(lǐng)域的一種結(jié) 合,也可以是一個領(lǐng)域中的一個小范圍。2.2.1領(lǐng)域本體的模型及

31、建模原語下面是一個用于領(lǐng)域知識表示的本體模型:領(lǐng)域本體是一個四元組O=C,l,R,Ax。其中:C是本體中的類集,I是類集C中的實例集,R是類集C上 的關(guān)系集合,類的繼承關(guān)系(is a)是最常見的類間關(guān)系,而 Ax是類間公理集合, 給出類集C的類之間屬性和關(guān)系的嚴格約束。13© 1 *>4-2010 Chirui Academic Journal Elec Iran ic PuKlijihing House. Al rights reserved, http: /'/wav .cnk i. iidt如果再把關(guān)系R詳細劃分為關(guān)系和函數(shù),就有了 Perez等人用分類法組織的

32、五元組本體:0=(C, R,F(xiàn),A,I),其中C、R、F、A和I分別是本體中概念、 關(guān)系、函數(shù)、公理和實例的集合,這五點也可以被稱為五個基本的建模原語。1、類(classes或概念(con cepts)概念(Concept)是一類對象的集合的抽象描述:C= O1,O2O n,其中Oi是領(lǐng)域中的對象。概念的含義很廣,可以表示任務、功能、行為、策略和推理過程等等。在實踐中,本體中的概念往往可以和類(Class)、類I(Category)、種類(Type) 通用。但是本體中的類與面向?qū)ο缶幊讨械念愂怯袇^(qū)別的, 兩者的重心不同,前 者關(guān)心類的結(jié)構(gòu)特征,而后者則關(guān)心類的操作特征。2、關(guān)系(Relatio

33、n)描述n個概念所含對象之間的聯(lián)系:0, C2Cn間的n元關(guān)系Rn:C1 x(c xxC是n個概念的笛卡兒乘積的任意子集。關(guān)系描述領(lǐng)域概念間的相互作用,基本的二元關(guān)系有4種:part-of,表示概念之間部分與整體的關(guān)系;kind-of,表示概念之間的繼承關(guān)系;instance-of表示 概念的實例與概念之間的關(guān)系;attribute-of示某個概念是另一個概念的屬性。在 實際建模中,概念之間的關(guān)系不限于這4種,可以根據(jù)領(lǐng)域的具體情況定義相應 的關(guān)系,例如connect-to。在實踐中,本體中的關(guān)系往往可以和性質(zhì)(Property)、屬性(Attribute)、角色(Role),槽(Slot)通

34、用,例如在描述邏輯中稱為Role,而在基于框架的表示中稱為 Slot。3、函數(shù)(Fu nctio n)F: C1XCcX-X£-1Cn,函數(shù)是一類特殊的關(guān)系,其前 n-1個元素可以唯一 的確定第n個元素,如Mother-of就是一個函數(shù),mother-of(x,y)表示y是x的母 親。4、公理(Axiom)公理是無需證明的永真斷言。公理在本體中有兩個作用:嚴格定義概念和在 本體所表達的知識范圍內(nèi)回答問題。5、實例(In sta nce 或 In dividual)實例表示元素,即概念對應的對象。一般認為,類C是具有類似性質(zhì)的所有個體的抽象。在領(lǐng)域本體中,實例I和類C緊密相關(guān),是本體中

35、最基本最具體的對象,個體從屬于某個類就成為這 個類的一個實例。類有外延和內(nèi)涵兩個側(cè)面。外延指類所代表的個體的范圍,可 以認為是類的所有實例構(gòu)成的集合;內(nèi)涵則是類的實例共同具有的所有性質(zhì)。某個個體是類的實例,當且僅當它具有內(nèi)涵中規(guī)定的所有性質(zhì);某種性質(zhì)在類的內(nèi)14© 1 *>4-2010 China Academic Journal ElBttranic PuKlijihing House. Al rights reserved, http:涵中,當且僅當類的所有實例都具有這種性質(zhì)。 本體中所有類和實例構(gòu)成本體的 論域。另外,在基于描述邏輯的本體中,公理A可以分為兩類:術(shù)語公理和

36、實例公理,實例公理對一個本體而言并非必需的,而術(shù)語公理則可以看成一類關(guān)系, 在實踐中往往定義為本體表示語言的描述符。 函數(shù)F和實例I不是必需的,可視 本體建模的詳盡程度而進行取舍。222本體建模語言目前有很多種本體語言,但歸結(jié)起來大體可以分為兩大類型:基于AI的本體實現(xiàn)語言和基于 Web的本體標記語言,以下我們將分別簡要介紹。一、基于AI的本體描述語言1、KIFKIF ( Knowledge Interchange Forma)是由斯坦福大學開發(fā)的。斯坦福(Sta nford)大學知識系統(tǒng)實驗室進行了關(guān)于知識本體的研究,包括研究知識的 本質(zhì)特征和基本屬性。在這項研究中,D. Bobrow, R

37、. Brachman和V. Lifschitz等AI專家提出了這種稱為知識交換格式(knowledge interchange format,簡稱 KIF)的知識描述語言,它的研究重點是語言的表達能力。它不同于KR系統(tǒng)間交換知識的格式,是一種基于一階邏輯的語言,特點是:它有公開的語義,不再 需要專門的解釋器;在邏輯上是全面的,可以對任意的邏輯語句進行表達; 可以 提供對元知識的表現(xiàn)。KIF和其它知識表示語言之間的區(qū)別在于它必須是和應用完全無關(guān)的,另 外必須具有足夠的表達能力使得所有其它的知識表示語言都有轉(zhuǎn)換成KIF標準格式的可能2、OntolinguaOn toli ngua 是一種基于 KI

38、F( Kn owledge in tercha nge format),提供統(tǒng)一的規(guī) 范格式來構(gòu)建本體的語言。它可以用來定義對象、函數(shù)和關(guān)系。KIF擁有明確的語義,它是基于一階謂詞邏輯運算的,并帶有注釋性的前綴。KIF還可以提供元知識的表示和非單調(diào)性的推理規(guī)則。KIF作為一種交互格式,從本質(zhì)上對本體進 行了規(guī)定。但這種用KIF寫出來的有關(guān)本體的規(guī)范說明相當乏味難懂。在Ontolingua中,定義本體是一種形式化和描述性的表示。它包含一個主體領(lǐng)域中 涉及到的詞匯(術(shù)語)以及描述這些詞匯是什么,之間如何相關(guān)和能否彼此相互 關(guān)聯(lián)的邏輯化的斷言。該語言支持 3種本體定義方式:(1)采用KIF表示;(2

39、)僅僅使用frame ontology的詞匯庫定義本體;(3)同時使用上述兩種表示 方式。Ontolingua包含KIF分析器、本體分析工具和一組 Ontolingua轉(zhuǎn)換器, 且獨立于特定表示系統(tǒng)的本體定義機制。其特點是:為構(gòu)造和維護本體,提供了統(tǒng)一的、計算機可讀的方式;由其構(gòu)造的本體可以方便的轉(zhuǎn)換到各種知識表示和15© 1 *>4-2010 Chirui Academic Journal Elec Iran ic PuKlijihing House. Al rights reserved, http: /'/wav .cnk i. iidt推理系統(tǒng)(Prolog、C

40、ORBA 的 IDL、CLIPS、LOOM、Epikit、Algernon 和 KIF), 從而將本體的維護與使用它的目標系統(tǒng)分離;主要用于本體服務器(on tologyserver)。3、CycLCycL是Cyc系統(tǒng)的描述語言,本質(zhì)上是一階謂詞邏輯(FOPC)的一種擴展。 它可以處理等詞、缺省推理、skolem化和其它一些二階特性,具有多種推理機 制(通用推理機制和特殊推理機制),命名唯一,且使用謂詞來表達概念之間的 關(guān)系,目前最多處理五元關(guān)系。CycL的特點是:在一階謂詞演算的基礎上擴充了等價推理、缺省推理等功 能;具備二階謂詞演算的能力;其語言環(huán)境中配有功能很強的可進行推理的推理 機。4

41、、LoomLoom是一種基于一階謂詞邏輯的知識表示語言,由美國南加洲大學信息科 學學院設計并實現(xiàn)。特點是:提供表達能力強、聲明性的規(guī)范說明語言;提供強 大的演繹推理能力,能供多種編程風格和知識庫服務。該語言后來發(fā)展成為 PowerLoom語言。PowerLoom是KIF的變體,它是基于邏輯的,可以提供表達 能力強、聲明性的規(guī)范說明語言,也可以提供強大的演繹推理能力,采用前規(guī)則(backward and forward chaine)作為推理機制。5、FlogicFlogic(Frame Logic)由卡爾斯魯厄大學開發(fā),可以表示概念、概念分類、二 元關(guān)系、函數(shù)、實例、公理和規(guī)則。與上述幾種語言

42、相比,它是唯一沒有采用LISP 語法的語言。其推理引擎 OntoBr可以用來進行約束檢查和演繹新知識。Flogic擁有一套模式理論的語義(A Model-theoretic Semantics)和一套完備的基于問題解 決方案的證明理論(Proof Theory)o FLogic軟件平臺從面向?qū)ο蟮难堇[型數(shù)據(jù)庫 (Deductive Databases發(fā)展成為本體,它可以融合其他的專門邏輯(如高階邏輯 HiLog、事務邏輯Transaction Logic。),并以此來改善本體中利用信息進行推理 的功能。6描述邏輯描述邏輯(Description Logic)是基于對象的形式化知識表示方式,它吸

43、取了KL-ONE的主要思想,是一階謂詞邏輯的一個可判定子集。描述邏輯中的 描述”是指對一個領(lǐng)域知識采用描述的方式表達,即利用概念和規(guī)則構(gòu)造符將原子概念 (一元謂詞)和原子規(guī)則(二元謂詞)構(gòu)建出描述表達式;邏輯”是指DL采用了正規(guī) 的基于邏輯的語義,這與語義網(wǎng)絡及框架等知識表示機制是不同的四。與一階謂詞邏輯所不同的是,描述邏輯系統(tǒng)能提供可判定的推理服務。在眾多知識表示的形式化方法中,描述邏輯在近年來頗受人們的關(guān)注,主要原因也在于強大的表16© 1 *>4-2010 China Academic Journal ElBttranic PuKlijihing House. Al ri

44、ghts reserved, http:達能力和清晰的模型理論機制,另外描述邏輯提供了很多推理服務,成為眾多流 行化本體描述語言的基礎。描述邏輯的知識庫 K=<T, A>由Tbox(術(shù)語)和Abox(斷言(Assertoin)兩個部 分組成,其中Tbox是一個關(guān)于包含斷言的有限集合,有如下形式: C D,這里 C和D為概念。通常我們用CO作為C D和D C的縮寫。ABox是實例斷言 的有限集合,形式為c(a),其中c是一個概念,a是一個個體,或者形為P(a, b), 其中P為一個原始關(guān)系,a和b為兩個個體。一般地,描述邏輯依據(jù)提供的構(gòu)造 符,在簡單的概念和關(guān)系上構(gòu)造出復雜的概念和關(guān)

45、系。通常描述邏輯至少包含以 下構(gòu)造符:交(G)、并(U)、非()、存在量詞()和全稱量詞(口),這種最基本的 描述的基礎上再添加不同的構(gòu)造符,則構(gòu)成不同的表達能力更強的描述邏輯。(1)描述邏輯的語法和語義表2.3中列出了描述邏輯的一般的語法和語義29:表2.3描述邏輯的一般語法及語義構(gòu)造苻的名稱構(gòu)造曲的語捷構(gòu)造符的不體縱釋TT通用類TJ =出丄空淇丄鼻0-.C原子否術(shù)舍取VAD図性值的束(VP.DY =aw M T0 w D,3ATWft存注妁康(3P.T)7|站"胡疋 嚴DJE-(nu£y 二 mur非限定性存在約束(3P.D)J 壬 W & I 站”捫 E 尸J

46、<nP 巔小數(shù)目灼束=口&|創(chuàng)3上比嚴藝町N廿(=nP)1 = <? e Ar | (tr,e F; J = «SnP最大皈目的束E“刊二佃e出|訕血時WD(2) 描述邏輯的推理功能描述邏輯的推理功能主要集中在以下兩個方面:包含(subsumption):即判斷一個概念是否為另一個概念的子集,主要用于概念的 自動分類;可滿足性(satisfiability ):即判斷一個概念與己有的概念集(本體)是否相容,主要用 于概念集合的一致性檢測。(3) 描述邏輯的特征描述邏輯具有有很強的表達能力和可判定性,能夠保證算法在合適的地方準 確的停止,且返回結(jié)果正確無誤,并可提供

47、有效的推理服務。描述邏輯的優(yōu)點17© 1*4-2010 China Academic Journal Electronic Publishing House. Al rigilts reserved.定義良好的語義和表達能力,清晰的模型一理論機制;具有很強的表達能力和可判定性;基于邏輯的推理能力,且提供了有效的推理算法,如著名的Tableaux的算法;推理工具的支持,如優(yōu)化的推理工具 FaCT、RACER等30。二、基于Web的本體描述語言1、RDF 和 RDF(S)RDF(資源描述框架,Resource Description Framework) RDF-S(RDF Schema

48、), 是W3C在XML的基礎上推薦的一種標準,用于表示任何的資源信息。RDF模型的基礎要素是三種類型的對象:(1)資源(resources,標識實際的以網(wǎng)絡 為基礎的資源,比如網(wǎng)頁和網(wǎng)絡應用程序。統(tǒng)一資源標識符(URI)可用來標識資源,每一個URI指向一個特定的網(wǎng)頁或網(wǎng)絡應用程序。(2)屬性(properties), 指定特定資源的屬性或特性。(3)聲明(stateme nts是資源和屬性的下一級延伸, 其作用是在一項特定的資源中為屬性分配屬性值。每個RDF聲明都用XML來表述。RDF的數(shù)據(jù)模型實質(zhì)上是一種二元關(guān)系的表達,由于任何復雜的關(guān)系都 可以分解為多個簡單的二元關(guān)系,因此 RDF的數(shù)據(jù)模

49、型可以作為其它任何復雜 關(guān)系模型的基礎模型。RDF具有通用性,并不限定于某個領(lǐng)域的網(wǎng)絡資源定義, 而它所描述的網(wǎng)絡資源也可以是任意格式的,既可以是XML格式的,也可以不是。總之,RDF是W3C提出的一種知識表示模型,它希望支持網(wǎng)絡上的知識共 享(sharing)與知識交換(Exchange)。RDF Schema則為RDF資源的屬性和類型提供定義良好的詞匯表。RDFS是一種用于定義 RDF schemas的聲明語言(Declarative Language)b RDFS的數(shù)據(jù)模 型(DM Data Model)是基于框架的(Frames-based)它為定義屬性與資源之間 的關(guān)系提供了機制,核

50、心的概念/類(Core classes是類、資源和屬性。RDF Schema 定義了一個類型系統(tǒng)(Type System),它與其他類型系統(tǒng)的區(qū)別在于對 類”的定 義,其他系統(tǒng)通過類的屬性來定義類,而RDF Schema通過從屬于哪些類的資源 來定義屬性。2、OILOIL是一種針對ontology的基于互聯(lián)網(wǎng)的表現(xiàn)和推理層。OIL以RDF Schema 為起點,用更為豐富的本體建模原語對 RDF Schema進行擴充,把基于框架表示 的方法應用于建?;?,實現(xiàn)了由描述邏輯來刻畫形式化的語義并以此為系統(tǒng)提 供有效的推理支持。OIL將框架系統(tǒng)、描述邏輯和 Web標準(XML和RDF)這 三個不同領(lǐng)

51、域的優(yōu)點結(jié)合起來,這三個領(lǐng)域的工作分別是:(1)基于框架的系統(tǒng):基于框架的語言的中心建模原語是類(稱作框架)和屬性(稱為槽)。(2)描述邏輯(DL):描述邏輯通過概念(對應于類或者框架)和角色(對應于槽) 描述知識。DL的一個重要特征是它們具有良好的理解理論性質(zhì),并且在DL中18 © 1 *>4-2010 China Academic Journal ElBttranic PuKlijihing House. Al rights reserved, http:任何表達的含義都可以通過數(shù)學的精確的方式描述, 而OIL就是從DL中繼承了 形式化語義和有效的推理支持。(3)互聯(lián)網(wǎng)標準

52、:這里指的是 XML和RDF, OIL標記語言的語法均源自 W3C的這些標準。一個OIL 本體用關(guān)鍵字begin-ontology 和end-ontology來描述,其中包 括on tology con tai ner和實際的本體定義兩大部分構(gòu)成。von tology>:=beg in-on tology<container>vdefi niti ons>end-on tology3、SHOESHOE (簡單HTML本體擴展)是一種可以內(nèi)嵌入 web頁面的基于本體的 知識表示語言。SHOE語言的簡單性是它的長處,SHOE本體可以讓大眾在 web 頁面上定位它們,可以建立

53、/擴展本體,而本體交互所能達到的程度是:可共享 同一祖先本體。如前所述,SHOE是基于HTML的Web上的知識表示語言,具 有XML兼容性。SHOE實際上是HTML的擴展集。它的開發(fā)首要是為了擴展 HTML,然后是在HTML或者其它Web文檔中合并機器可讀的語義知識。 最近, 研究人員又對SHOE進行了調(diào)整,使之更適應于 XML。SHOE的目的在于使代 理可以收集網(wǎng)頁上、文檔中的有用信息,改進搜索機制和知識收集。SHOE有三種類型的推理子從句:分類、關(guān)系和比較。它通過建立邏輯,將數(shù)據(jù)和本體分離開來,允許本體在數(shù)據(jù)層面上提供不同視圖。通過映射SHOE到這個邏輯可展示一個本體修訂的不同類型是怎樣影

54、響已存在的數(shù)據(jù)源的。另外要注意的是增加分類或關(guān)系的修訂不會產(chǎn)生什么影響,而修改規(guī)則的修訂會改變查詢結(jié)果以及刪除分類或關(guān)系的修訂可能消除確定的答案。4、XOLXOL(Ontology Exchange Language)是 SRI International 的人工智能中心(AIC)開發(fā)的。它是一種簡單通用的定義本體的方法, 以Ontolingua和XML(本 體標記語言)為基礎,融合了 OKBC的高層表達方式和OML語法。其目的是在 不同的數(shù)據(jù)庫、本體開發(fā)工具、或者其它應用程序之間交換本體。XOL設計之初是為生物信息學領(lǐng)域本體的交換,但是它可以應用于各種領(lǐng)域。目前沒有支持 XOL本體開發(fā)的工具

55、,但由于它采用 XML語法,所以可以采用XML編輯器創(chuàng) 建XOL文件。XOL基本上不用于本體開發(fā),但是可以在不同的數(shù)據(jù)庫系統(tǒng)間、 不同的本體開發(fā)工具間或應用程序間作為本體傳遞的中介語言。5、OWL19© 1 *>4-2010 Chirui Academic Journal Elec Iran ic PuKlijihing House. Al rights reserved, http: /'/wav .cnk i. iidtOWL (Web Ontology Language)位于 W3C 繪制的 ontology 語言棧的棧頂,應用中不僅僅需要提供給用戶可讀的文檔內(nèi)容

56、,而且希望處理文檔內(nèi)容信息。OWL能夠被用于清晰地表達詞匯表中的詞條(term)的含義以及這些詞條之間 的關(guān)系。由于OWL擁有更多的機制來表達語義,從而超越了 XML、RDF和RDF Schema僅能表達網(wǎng)上機器可讀的文檔內(nèi)容的能力。圖2.1 ontology語言棧(1)OWL子語言OWL提供了三種表達能力遞增的子語言 OWL Lite、OWL DL和OWL Full, 分別用于特定的用戶群體。OWL Lite用于提供給那些只需要一個分類層次和簡單約束的用戶。例如, 雖然OWL Lite支持基數(shù)限制,但只允許基數(shù)為0或1。提供支持OWL Lite的工 具應該比支持其他表達能力更強的 OWL子語

57、言更簡單,并且從辭典(thesuari)和 分類系統(tǒng)(taxonomy)轉(zhuǎn)換到OWLLite更為迅速。相比 OWL DL,OWL Lite還具 有更低的形式復雜度。OWL DL用于支持強表達能力的同時需要保持計算的完備性(computati noalcompleteness,即所有的結(jié)論都能夠確保被計算出來)和可判定性(decidbaility,即 所有的計算都能在有限的時間內(nèi)完成)的知識表示。OWL DL包括了 OWL語言 的所有語言成分,但使用時必須符合一定的約束,例如,一個類可以是多個類的 子類,但它不能同時是另外一個類的實例。OWL DL的命名起因于它對應于描述 邏輯,這是一個研究作為 OWL形式基礎的邏輯的研究領(lǐng)域。OWL Full支持最

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論