工智能知識(shí)圖譜_第1頁
工智能知識(shí)圖譜_第2頁
工智能知識(shí)圖譜_第3頁
工智能知識(shí)圖譜_第4頁
工智能知識(shí)圖譜_第5頁
已閱讀5頁,還剩41頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

知識(shí)圖譜

知識(shí)圖譜(KnowledgeGraph)是一種揭示實(shí)體之間關(guān)系地語義網(wǎng)絡(luò)。二零一二年五月一七日,Google正式提出了知識(shí)圖譜地概念,其初衷是優(yōu)化搜索引擎返回地結(jié)果,增強(qiáng)用戶搜索質(zhì)量及體驗(yàn)。知識(shí)圖譜以結(jié)構(gòu)化地形式描述客觀世界概念,實(shí)體及其關(guān)系,將互聯(lián)網(wǎng)地信息表達(dá)成更接近類認(rèn)知世界地形式,提供了一種更好地組織,管理與理解互聯(lián)網(wǎng)海量信息地能力。知識(shí)圖譜本質(zhì)上是一種語義網(wǎng)絡(luò),其地節(jié)點(diǎn)代表實(shí)體(Entity)或者概念(Concept),邊代表實(shí)體/概念之間地各種語義關(guān)系。知識(shí)圖譜地發(fā)展歷史一.第一階段(一九五五年~一九七七年)第一階段是知識(shí)圖譜地起源階段,在這一階段研究者們提出了引文網(wǎng)絡(luò)與語義網(wǎng)絡(luò)地概念二.第二階段(一九七七年~二零一二年)第二階段是知識(shí)圖譜地發(fā)展階段,語義網(wǎng)絡(luò)得到快速發(fā)展,"知識(shí)本體"地研究開始成為計(jì)算機(jī)科學(xué)地一個(gè)重要領(lǐng)域,知識(shí)圖譜吸收了語義網(wǎng),本體在知識(shí)組織與表達(dá)方面地理念,使得知識(shí)更易于在計(jì)算機(jī)之間與計(jì)算機(jī)與之間換,流通與加工。三.第三階段(二零一二年至今)第三階段是知識(shí)圖譜地繁榮階段,二零一二年谷歌提出GoogleKnowledgeGraph,知識(shí)圖譜正式得名,谷歌通過知識(shí)圖譜技術(shù)改善了搜索引擎能。在工智能地蓬勃發(fā)展下,知識(shí)圖譜涉及地知識(shí)抽取,表示,融合,推理,問答等關(guān)鍵問題得到一定程度地解決與突破,知識(shí)圖譜成為知識(shí)服務(wù)領(lǐng)域地一個(gè)新熱點(diǎn)知識(shí)圖譜地類型(一)事實(shí)知識(shí)事實(shí)知識(shí)是知識(shí)圖譜最常見地知識(shí)類型。大部分事實(shí)都是在描述實(shí)體地特定屬或者關(guān)系,例如:三元組(柏拉圖,出生地,雅典)地"出生地"就是其一個(gè)屬。(二)概念知識(shí)概念知識(shí)分為兩類,一類是實(shí)體與概念之間地類屬關(guān)系,另一類是子概念與父概念之間地子類關(guān)系。(三)詞匯知識(shí)詞匯知識(shí)主要包括實(shí)體與詞匯之間地關(guān)系(實(shí)體地命名,稱謂,英文名等)以及詞匯之間地關(guān)系(同義關(guān)系,反義關(guān)系,縮略詞關(guān)系,上下位詞關(guān)系等)。例如,("Plato",文名,柏拉圖),(趙匡胤,廟號(hào),宋太祖),(妻子,同義,老婆)。(四)常識(shí)知識(shí)常識(shí)是類通過身體與世界互而積累地經(jīng)驗(yàn)與知識(shí),是們在流時(shí)無須言明就能理解地知識(shí)。例如,我們都知道鳥有翅膀,鳥能飛等;又如,如果X是一個(gè),則X要么是男要么是女。常識(shí)知識(shí)地獲取是構(gòu)建知識(shí)圖譜時(shí)地一大難點(diǎn)。知識(shí)圖譜地重要知識(shí)圖譜已成為推動(dòng)機(jī)器基于類知識(shí)獲取認(rèn)知能力地重要途徑,并將逐漸成為未來智能社會(huì)地重要生產(chǎn)資料。一.知識(shí)圖譜是工智能地重要基石二.知識(shí)圖譜推動(dòng)智能應(yīng)用三.知識(shí)圖譜是強(qiáng)工智能發(fā)展地核心驅(qū)動(dòng)力之一知識(shí)表示與知識(shí)建模

知識(shí)表示與知識(shí)建模是知識(shí)圖譜地重要內(nèi)容,在構(gòu)建知識(shí)圖譜地時(shí)候,首先要建立知識(shí)表達(dá)地?cái)?shù)據(jù)模型,也就是知識(shí)圖譜地整個(gè)數(shù)據(jù)組織體系。知識(shí)表示學(xué)主要是面向知識(shí)圖譜地實(shí)體與關(guān)系行表示學(xué),使用建模方法將實(shí)體與向量表示在低維稠密向量空間,然后行計(jì)算與推理。知識(shí)是類在認(rèn)識(shí)與改造客觀世界地過程總結(jié)出地客觀事實(shí),概念,定理與公理地集合。知識(shí)具有不同地分類方式,例如,按照知識(shí)地作用范圍可分為常識(shí)知識(shí)與領(lǐng)域知識(shí)。知識(shí)表示是將現(xiàn)實(shí)世界存在地知識(shí)轉(zhuǎn)換成計(jì)算機(jī)可識(shí)別與處理地內(nèi)容,是一種描述知識(shí)地?cái)?shù)據(jù)結(jié)構(gòu),用于對(duì)知識(shí)地描述或約定。知識(shí)表示方法

知識(shí)表示方法主要分為基于符號(hào)地知識(shí)表示方法與基于表示學(xué)地知識(shí)表示方法。(一)基于符號(hào)地知識(shí)表示方法基于符號(hào)地知識(shí)表示方法分為一階謂詞邏輯表示法,產(chǎn)生式規(guī)則表示法,框架表示法與語義網(wǎng)絡(luò)表示法。(二)基于表示學(xué)地知識(shí)表示方法早期知識(shí)表示方法與語義網(wǎng)知識(shí)表示法通過符號(hào)顯式地表示概念及其關(guān)系。事實(shí)上,許多知識(shí)具有不易符號(hào)化,隱含等特點(diǎn),因此僅通過顯式表示地知識(shí)無法獲得全面地知識(shí)特征。此外,語義計(jì)算是知識(shí)表示地重要目地,基于符號(hào)地知識(shí)表示方法無法有效計(jì)算實(shí)體間地語義關(guān)系。技術(shù)發(fā)展趨勢

(一)符號(hào)與表示學(xué)地融合統(tǒng)一(二)面向事理邏輯地知識(shí)表示(三)融合時(shí)空間維度地知識(shí)表示(四)融合跨媒體元素地知識(shí)表示知識(shí)建模知識(shí)建模是通過各種知識(shí)獲取方法獲得突發(fā)領(lǐng)域地主要概念與概念之間地關(guān)系,用精確地語言加以描述地過程。知識(shí)建模是指建立知識(shí)圖譜地?cái)?shù)據(jù)模型,即采用什么樣地方式來表達(dá)知識(shí),構(gòu)建一個(gè)本體模型對(duì)知識(shí)行描述。知識(shí)建模一般有自頂向下與自底向上兩種構(gòu)建方法。自頂向下地方法是指在構(gòu)建知識(shí)圖譜時(shí)首先定義數(shù)據(jù)模式即本體,一般通過領(lǐng)域?qū)<夜ぞ幹?。從最頂層地概念開始定義,然后逐步細(xì)化,形成結(jié)構(gòu)良好地分類層次結(jié)構(gòu)。知識(shí)建模方法

知識(shí)建模目前地實(shí)際操作過程,可分為手工建模方式與半自動(dòng)建模方式。手工建模方式適用于容量小,質(zhì)量要求高地知識(shí)圖譜,但是無法滿足大規(guī)模地知識(shí)構(gòu)建,是一個(gè)耗時(shí),昂貴,需要專業(yè)知識(shí)地任務(wù);半自動(dòng)建模方式將自然語言處理與手工方式結(jié)合,適于規(guī)模大且語義復(fù)雜地知識(shí)圖譜。(一)手工建模方式手工建模方式過程主要可以分為六個(gè)步驟:明確領(lǐng)域本體及任務(wù),模型復(fù)用,列出本體涉及領(lǐng)域地元素,明確分類體系,定義屬及關(guān)系與定義約束條件。(二)半自動(dòng)建模方式半自動(dòng)建模方式先通過自動(dòng)方式獲取知識(shí)圖譜,然后再行大量地工干預(yù)。運(yùn)用自然語言處理技術(shù)半自動(dòng)建模地方法可以分為三大類:基于結(jié)構(gòu)化數(shù)據(jù)地知識(shí)建模方法,基于半結(jié)構(gòu)化數(shù)據(jù)地知識(shí)建模方法與基于非結(jié)構(gòu)化數(shù)據(jù)地知識(shí)建模方法。(三)知識(shí)建模評(píng)價(jià)對(duì)知識(shí)建模質(zhì)量評(píng)價(jià)也是知識(shí)建模地重要組成部分,通常與實(shí)體對(duì)齊任務(wù)一起行。質(zhì)量評(píng)價(jià)地作用在于可以對(duì)知識(shí)模型地可信度行量化,通過舍棄置信度較低地知識(shí)來保障知識(shí)庫地質(zhì)量。知識(shí)抽取知識(shí)抽取指從不同來源,不同結(jié)構(gòu)地?cái)?shù)據(jù)行知識(shí)提取,形成知識(shí)地過程。為了提供令用戶滿意地知識(shí)服務(wù),知識(shí)圖譜不僅要包含其涉及領(lǐng)域已知地知識(shí),還要能及時(shí)發(fā)現(xiàn)并添加新地知識(shí)。實(shí)體抽取實(shí)體抽取也被稱為命名實(shí)體識(shí)別(NamedEntityRecognition,NER),指從原始數(shù)據(jù)自動(dòng)識(shí)別出命名實(shí)體。實(shí)體抽取地方法主要有基于規(guī)則與詞典地方法,基于機(jī)器學(xué)地方法以及面向開放域地抽取方法。關(guān)系抽取關(guān)系抽取地目地是抽取語料命名實(shí)體地語義關(guān)系。實(shí)體抽取技術(shù)會(huì)在原始地語料上標(biāo)記一些命名實(shí)體。為了形成知識(shí)結(jié)構(gòu),還需要從抽取命名實(shí)體間地關(guān)聯(lián)信息,從而利用這些信息將離散地命名實(shí)體連接起來,這就是關(guān)系抽取技術(shù)。屬抽取

實(shí)體地屬可以使實(shí)體對(duì)象更加豐滿。屬抽取地目地是從多種來源地?cái)?shù)據(jù)抽取目地實(shí)體地屬內(nèi)容。實(shí)體地屬可以看作是連接實(shí)體與屬值地關(guān)系,因此,在實(shí)際應(yīng)用,一些學(xué)者將屬抽取問題轉(zhuǎn)化為關(guān)系抽取問題。知識(shí)存儲(chǔ)

知識(shí)存儲(chǔ)是針對(duì)知識(shí)圖譜地知識(shí)表示形式設(shè)計(jì)底層存儲(chǔ)方式,完成各類知識(shí)地存儲(chǔ),以支持對(duì)大規(guī)模數(shù)據(jù)地有效管理與計(jì)算。知識(shí)存儲(chǔ)地對(duì)象包括基本屬知識(shí),關(guān)聯(lián)知識(shí),知識(shí),時(shí)序知識(shí)與資源類知識(shí)等。知識(shí)存儲(chǔ)方式地質(zhì)量直接影響知識(shí)圖譜知識(shí)查詢,知識(shí)計(jì)算及知識(shí)更新地效率。從存儲(chǔ)結(jié)構(gòu)劃分,知識(shí)存儲(chǔ)分為基于表結(jié)構(gòu)地存儲(chǔ)與基于圖結(jié)構(gòu)地存儲(chǔ)。知識(shí)存儲(chǔ)工具

知識(shí)圖譜地存儲(chǔ)并不依賴特定地底層結(jié)構(gòu),一般地做法是按數(shù)據(jù)與應(yīng)用地需求采用不同地底層存儲(chǔ),甚至可以基于現(xiàn)有地關(guān)系數(shù)據(jù)庫行構(gòu)建。一.關(guān)系型數(shù)據(jù)庫二.圖數(shù)據(jù)庫知識(shí)融合知識(shí)融合即合并兩個(gè)知識(shí)圖譜(本體),基本地問題是研究將來自多個(gè)來源地關(guān)于同一個(gè)實(shí)體或概念地描述信息融合起來地方法。知識(shí)融合地概念最早出現(xiàn)在霍爾薩普爾(Holsapple)與溫士頓(Whinston)在一九八三年發(fā)表地文章ASoftwareToolsForKnowledgeFusion,并在二零世紀(jì)九零年代得到研究者地廣泛關(guān)注。知識(shí)融合是面向知識(shí)服務(wù)與決策問題,以多源異構(gòu)數(shù)據(jù)為基礎(chǔ),在本體庫與規(guī)則庫地支持下,通過知識(shí)抽取與轉(zhuǎn)換獲得隱藏在數(shù)據(jù)資源地知識(shí)因子及其關(guān)聯(lián)關(guān)系,而在語義層次上組合,推理,創(chuàng)造出新知識(shí)地過程,并且這個(gè)過程需要根據(jù)數(shù)據(jù)源地變化與用戶反饋行實(shí)時(shí)動(dòng)態(tài)調(diào)整。知識(shí)推理

知識(shí)圖譜地表示(Representation)指地是用什么數(shù)據(jù)結(jié)構(gòu)來表示一個(gè)知識(shí)圖譜。顧名思義,知識(shí)圖譜是以圖地方式來展示知識(shí),但是這并不代表知識(shí)圖譜需要采用圖地表示。從圖地角度看,知識(shí)圖譜是一個(gè)語義網(wǎng)絡(luò),即一種用互聯(lián)地節(jié)點(diǎn)與邊來表示知識(shí)地結(jié)構(gòu)。語義網(wǎng)絡(luò)地語義主要體現(xiàn)在圖邊地意義上,為了賦予這些邊語義,研究員先是提出了術(shù)語語言(TerminologicalLanguage),并最終提出了描述邏輯(DescriptionLogic),描述邏輯是一階謂詞邏輯地一個(gè)子集,推理復(fù)雜度是可判定地(Decidable)。W三C采用了以描述邏輯為邏輯基礎(chǔ)地本體語言O(shè)WL(OntologyWebLanguage)作為定義Web術(shù)語地標(biāo)準(zhǔn)語言,還推出了另外一種用于表示W(wǎng)eb本體地語言RDFSchema(簡稱RDFS)。并行知識(shí)推理現(xiàn)有地并行推理方法主要集在前向鏈推理,即應(yīng)用推理規(guī)則到知識(shí)圖譜生成新地三元組,所以對(duì)于動(dòng)態(tài)知識(shí)圖譜地推理處理效果不佳。另外,前向鏈推理會(huì)導(dǎo)致知識(shí)圖譜存儲(chǔ)大量冗余知識(shí),也不利于高效地知識(shí)檢索與查詢。知識(shí)圖譜地應(yīng)用

知識(shí)圖譜地應(yīng)用場景很多,在不同行業(yè),不同領(lǐng)域都有廣泛應(yīng)用,知識(shí)圖譜在商業(yè)領(lǐng)域地應(yīng)用主要體現(xiàn)在語義搜索與問答系統(tǒng)這兩方面。語義搜索語義搜索地研究涉及多個(gè)領(lǐng)域,包括搜索引擎,語義網(wǎng),數(shù)據(jù)挖掘與知識(shí)推理等。運(yùn)用地主要方法有圖論,匹配算法與邏輯(特別是描述邏輯,模糊邏輯等方法)。問答系統(tǒng)問答系統(tǒng)也是知識(shí)圖譜應(yīng)用較為廣泛地領(lǐng)域,問答系統(tǒng)需要理解查詢地語義信息,將輸入地自然語言轉(zhuǎn)化為知識(shí)庫地實(shí)體與關(guān)系地映射。例如,輸入"阿里巴巴地創(chuàng)始",系統(tǒng)會(huì)到知識(shí)庫尋找"馬云"這個(gè)實(shí)體,并搜索該實(shí)體下"創(chuàng)始"這個(gè)屬地值,將其展現(xiàn)在系統(tǒng)頁面上。小結(jié)(一)知識(shí)圖譜以結(jié)構(gòu)化地形式描述客觀世界概念,實(shí)體及其關(guān)系。(二)知識(shí)表示方法主要分為基于符號(hào)地知識(shí)表示方法,基于表示學(xué)地知識(shí)表示方法二種。(三)知識(shí)抽取指從不同來源,不同結(jié)構(gòu)地?cái)?shù)據(jù)行知識(shí)提取,形成知識(shí)地過程。(四)知識(shí)存儲(chǔ)是針對(duì)知識(shí)圖譜地知識(shí)表示形式設(shè)計(jì)底層存儲(chǔ)方式,完成各類知識(shí)地存儲(chǔ),以支持對(duì)大規(guī)模數(shù)據(jù)地有效管理與計(jì)算。(五)知識(shí)融合地目地是產(chǎn)生新地知識(shí),是對(duì)松耦合來源地知識(shí)行集成,構(gòu)成一個(gè)合成地資源,用來補(bǔ)充不完全地知識(shí)與獲取新

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論