版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
2022-2023年知識圖譜行業(yè)現(xiàn)狀與投資規(guī)劃分析報告匯報人:REPORTERContents目錄行業(yè)概況01行業(yè)發(fā)展環(huán)境02行業(yè)現(xiàn)狀03行業(yè)前景趨勢0401行業(yè)概況Loremipsumdolorsitamet,consetetursadipscingelitr,seddiamnonumyeirmodtemporinviduntutlaboreetPART01|行業(yè)定義Loremipsumdolorsitamet,consetetursadipscingelitr,seddiamnonumyeirmodtemporinvidunt行業(yè)定義“知識圖譜指對現(xiàn)實世界事物之間的相互關(guān)系進(jìn)行形式化描述的結(jié)構(gòu)化語義知識網(wǎng)絡(luò)?!皩嶓w-關(guān)系-實體”、“實體-屬性-屬性值”三元組是知識圖譜的基礎(chǔ)表達(dá)方式,其中包含實體、概念、屬性、屬性值、關(guān)系等元素。實體指具有可區(qū)別性且獨立存在的事物,如“中國”、“比爾蓋茨”等;概念指具有同種特性的實體構(gòu)成的集合,如“國家”、“民族”等;屬性指實體具有的特征、特性、特點,如“面積”、“性別”、“生日”等;屬性值指實體指定屬性的值,如“960萬平方公里”、“男”、“1988年5月17日”等;關(guān)系指實體之間的關(guān)聯(lián)描述,如“妻子”、“朋友”、“首都”等。知識圖譜以實體或概念作為節(jié)點,關(guān)系或?qū)傩宰鳛檫?,形成語義知識網(wǎng)絡(luò)圖。知識圖譜的應(yīng)用價值主要體現(xiàn)在通過圖形的方式向用戶展示經(jīng)整理加工的結(jié)構(gòu)化知識。知識圖譜是人工智能重要分支知識工程在大數(shù)據(jù)環(huán)境中的應(yīng)用體現(xiàn),已廣泛應(yīng)用到金融反欺詐、公安情報分析、流程自動化、智能客服等多個場景,逐漸成為人工智能發(fā)展的核心驅(qū)動力之一。”早期人工智能(1950-1970年)02|發(fā)展歷程知識工程(1970-1990年)萬維網(wǎng)Web0(1990-2000年)群體智能(2000-2012年)1950年,英國數(shù)學(xué)家、邏輯學(xué)家艾倫圖靈提出圖靈測試,為人工智能的誕生作出了鋪墊。1956年,人工智能正式誕生于美國達(dá)特茅斯會議,人工智能自此進(jìn)入初步發(fā)展階段,關(guān)注度不斷提升。這一階段以符號主義和聯(lián)結(jié)主義為主導(dǎo),符號主義認(rèn)為智能行為的本質(zhì)是物理符號的操作和運算,聯(lián)結(jié)主義則認(rèn)為大腦(神經(jīng)元及其連接機(jī)制)是一切智能活動的基礎(chǔ)。這一時期的知識表示方法主要有邏輯知識表示、產(chǎn)生式規(guī)則等。20世紀(jì)70年代初,人工智能遇到了發(fā)展瓶頸,過于強(qiáng)調(diào)利用人的求解問題能力而忽視知識對智能的支持,令人工智能難以實現(xiàn)實際應(yīng)用。在此背景下,人工智能領(lǐng)域?qū)<抑饾u認(rèn)識到知識對于人工智能發(fā)展的重要性,人工智能開始轉(zhuǎn)向建立基于知識的系統(tǒng)。1977年,美國科學(xué)家愛德華費根鮑姆提出知識工程的定義,明確了知識工程在人工智能發(fā)展中的關(guān)鍵地位,知識工程自此進(jìn)入快速發(fā)展期,這一時期涌現(xiàn)出一批通過知識庫和推理機(jī)混合作用實現(xiàn)智能的專家系統(tǒng)和開發(fā)平臺。在1990至2000年間,萬維網(wǎng)Web0逐漸興起,成為大眾共享信息的公共平臺,一批人工構(gòu)建大規(guī)模知識庫亦在此背景下出現(xiàn),如英文的WordNet,中文的HowNet等。1998年,萬維網(wǎng)之父蒂姆伯納斯李提出語義網(wǎng),語義網(wǎng)直接向機(jī)器提供可直接用于程序處理的知識表示,是自然語言處理的前身。萬維網(wǎng)Web0開啟了知識共享時代,為互聯(lián)網(wǎng)環(huán)境下大規(guī)模知識表示和共享奠定了基礎(chǔ)。在2000至2012年間,萬維網(wǎng)使知識從封閉走向開放,從集中式變?yōu)榉植际?,知識可以由知識源之間的關(guān)聯(lián)產(chǎn)生,而非只能固定由專家系統(tǒng)內(nèi)部定義產(chǎn)生,群體智能由此出現(xiàn),典型代表為維基百科,知識可以由用戶建立,互聯(lián)網(wǎng)大眾用戶可對知識庫的建立和完善作出貢獻(xiàn),群體智能亦成為后一階段大規(guī)模結(jié)構(gòu)化知識圖譜的重要前提。知識圖譜行業(yè)產(chǎn)業(yè)鏈上游的數(shù)據(jù)提供方主要負(fù)責(zé)從各類數(shù)據(jù)來源處采集、挖掘數(shù)據(jù),并對數(shù)據(jù)進(jìn)行預(yù)處理和前期結(jié)構(gòu)化,數(shù)據(jù)來源除了包括社交網(wǎng)絡(luò)、網(wǎng)絡(luò)日志、網(wǎng)頁等互聯(lián)網(wǎng)公開渠道,還包括定位系統(tǒng)、傳感器等物聯(lián)網(wǎng)感知設(shè)備。根據(jù)特定業(yè)務(wù)需要,數(shù)據(jù)提供方還會從知識圖譜平臺服務(wù)商的客戶處采集數(shù)據(jù),對數(shù)據(jù)進(jìn)行前期結(jié)構(gòu)化處理,再將數(shù)據(jù)轉(zhuǎn)送給知識圖譜服務(wù)平臺進(jìn)行下一步的知識圖譜構(gòu)建。目前,較大部分知識圖譜服務(wù)平臺均自建前期數(shù)據(jù)服務(wù)團(tuán)隊進(jìn)行前期數(shù)據(jù)采集、挖掘、預(yù)處理,再根據(jù)實際業(yè)務(wù)需要從第三方數(shù)據(jù)服務(wù)商處購買相關(guān)數(shù)據(jù)服務(wù)來完善前期數(shù)據(jù)庫。因此,數(shù)據(jù)提供方主要可分為知識圖譜平臺自建數(shù)據(jù)庫和第三方數(shù)據(jù)庫。知識圖譜平臺自建數(shù)據(jù)庫典型代表為天眼查、企查查等工商信息服務(wù)商,這類服務(wù)商通過網(wǎng)絡(luò)爬蟲等技術(shù)從互聯(lián)網(wǎng)公開渠道采集、挖掘企業(yè)的工商信息搭建前期數(shù)據(jù)信息庫并進(jìn)行預(yù)處理,完成初步結(jié)構(gòu)化后再利用知識圖譜技術(shù)構(gòu)建企業(yè)的工商信息知識圖譜。第三方數(shù)據(jù)庫主要可分為兩種,一種根據(jù)特定業(yè)務(wù)需求從非結(jié)構(gòu)化文本數(shù)據(jù)中采集、挖掘數(shù)據(jù),另一種是預(yù)先建成的結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)庫。開放鏈接知識庫是結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)庫的典型代表,包括面向通用領(lǐng)域的DBpedia、Wikidata、YAGO,也包括面向垂直領(lǐng)域的IMDB、豆瓣等。開放鏈接知識庫已將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化成半結(jié)構(gòu)化、結(jié)構(gòu)化數(shù)據(jù),包含大量實體、屬性等數(shù)據(jù),是構(gòu)建知識圖譜的重要數(shù)據(jù)來源。04|產(chǎn)業(yè)鏈上游知識圖譜行業(yè)產(chǎn)業(yè)鏈中游的知識圖譜服務(wù)平臺主要負(fù)責(zé)構(gòu)建知識圖譜和提供具體場景應(yīng)用服務(wù),是知識圖譜產(chǎn)業(yè)鏈生態(tài)中的關(guān)鍵主體。知識圖譜服務(wù)平臺將來自上游數(shù)據(jù)提供方的初步結(jié)構(gòu)化數(shù)據(jù)進(jìn)行信息抽取、知識融合、知識加工,逐步構(gòu)建起知識圖譜,再為下游最終用戶提供具體場景應(yīng)用服務(wù),應(yīng)用領(lǐng)域包括金融、客服、工業(yè)、科研、醫(yī)療等。目前,知識圖譜產(chǎn)業(yè)鏈中游市場較為活躍,競爭者主要包括互聯(lián)網(wǎng)巨頭旗下的知識圖譜平臺、傳統(tǒng)解決方案商旗下知識圖譜平臺和初創(chuàng)型知識圖譜平臺。百度、阿里巴巴、騰訊等互聯(lián)網(wǎng)巨頭均布局了知識圖譜相關(guān)業(yè)務(wù),如百度的“知心”、騰訊的“星圖”、阿里巴巴的商品知識圖譜等,互聯(lián)網(wǎng)巨頭在技術(shù)團(tuán)隊組建、大數(shù)據(jù)處理等方面經(jīng)驗較豐富、優(yōu)勢較為明顯,成為知識圖譜平臺服務(wù)的第一梯隊。傳統(tǒng)解決方案商也是知識圖譜平臺服務(wù)的重要競爭者,東軟、北大醫(yī)信、鼎富科技、中興等傳統(tǒng)解決方案商以解決方案為出發(fā)點,將知識圖譜技術(shù)嵌入到解決方案場景當(dāng)中,以提升解決方案產(chǎn)品質(zhì)量。以知識圖譜平臺服務(wù)為核心的初創(chuàng)型企業(yè)也逐步進(jìn)入市場,參與到市場競爭中,如明略數(shù)據(jù)、竹間智能、達(dá)觀數(shù)據(jù)等。相比互聯(lián)網(wǎng)巨頭旗下的知識圖譜平臺,初創(chuàng)型知識圖譜平臺更注重在金融、客服、醫(yī)療等垂直領(lǐng)域深耕,而非通用性。初創(chuàng)型知識圖譜平臺發(fā)展迅速,在垂直領(lǐng)域應(yīng)用服務(wù)水平不斷提升,逐漸成為市場有力競爭者。04|產(chǎn)業(yè)鏈中游知識圖譜行業(yè)產(chǎn)業(yè)鏈下游主體為知識圖譜服務(wù)的最終用戶,包括企業(yè)、政府、個人等。中游的知識圖譜服務(wù)平臺為下游的最終用戶提供具體應(yīng)用場景服務(wù),目前,應(yīng)用場景以金融反欺詐、智能客服、醫(yī)療輔助診斷等居多。金融反欺詐的應(yīng)用用戶主要為金融機(jī)構(gòu),如銀行、貸款公司等,通過知識圖譜技術(shù)可將借款人的基本信息、消費記錄、人際關(guān)系、通話記錄等相關(guān)信息進(jìn)一步結(jié)構(gòu)化,從而可以對借款風(fēng)險進(jìn)行更到位的評估和分析。智能客服的應(yīng)用用戶主要為政府和各類型企業(yè),知識圖譜可以為政府、各類企業(yè)的咨詢類業(yè)務(wù)梳理業(yè)務(wù)邏輯結(jié)構(gòu),搭建起清晰的信息反饋框架,提高智能客服服務(wù)質(zhì)量。醫(yī)療輔助診斷的應(yīng)用用戶主要為醫(yī)療機(jī)構(gòu),通過知識圖譜技術(shù)可以將龐雜的疾病、癥狀、臨床表現(xiàn)、身體部分、體檢手段等醫(yī)療信息數(shù)據(jù)進(jìn)一步結(jié)構(gòu)化,形成知識網(wǎng)絡(luò),醫(yī)療機(jī)構(gòu)根據(jù)癥狀和疾病的關(guān)系推測患者可能患有的疾病,根據(jù)疾病可能性推薦就診科室、檢查檢驗方案,提高醫(yī)療工作效率。除金融反欺詐、智能客服、醫(yī)療輔助診斷等應(yīng)用場景,知識圖譜的應(yīng)用場景還在不斷拓展,知識圖譜在科研、工業(yè)、安防等領(lǐng)域亦有廣闊應(yīng)用發(fā)展前景。目前,知識圖譜的最終用戶以政府和企業(yè)居多,包括公安機(jī)關(guān)、金融機(jī)構(gòu)、醫(yī)療機(jī)構(gòu)等,而個人用戶相對較少,個人用戶主要在信息查詢等場景參與應(yīng)用,如天眼查、企查查等工商信息查詢服務(wù),通過工商信息知識圖譜更直接、清晰地了解股權(quán)架構(gòu)、任職關(guān)系等企業(yè)工商背景信息。04|產(chǎn)業(yè)鏈下游02行業(yè)發(fā)展環(huán)境Loremipsumdolorsitamet,consetetursadipscingelitr,seddiamnonumyeirmodtemporinviduntutlaboreetPART01|行業(yè)政策以“智能制造”和“互聯(lián)網(wǎng)+人工智能”為出發(fā)點,開始重點關(guān)注人工智能領(lǐng)域的發(fā)展布局,提出要加快人工智能核心技術(shù)突破,提高各行業(yè)的智能化水平?!蛾P(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》人工智能正式被寫入“十三五”規(guī)劃綱要中,成為“十三五”建設(shè)期間重點布局的新興發(fā)展領(lǐng)域之一?!妒濉币?guī)劃綱》提出到2030年中國人工智能理論、技術(shù)、應(yīng)用總體達(dá)到世界領(lǐng)先水平?!缎乱淮斯ぶ悄馨l(fā)展規(guī)劃》國務(wù)院國務(wù)院國務(wù)院02|行業(yè)政策提出鼓勵建設(shè)提供知識圖譜等共性服務(wù)的開放性云平臺,以充實人工智能訓(xùn)練資源庫,是鼓勵知識圖譜和深度學(xué)習(xí)技術(shù)融合發(fā)展的體現(xiàn)?!洞龠M(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計劃(2018-2020)》針對人工智能17個細(xì)分領(lǐng)域提出發(fā)展要求,提出要開展集中攻關(guān),重點突破一批創(chuàng)新性強(qiáng)、應(yīng)用效果好的人工智能標(biāo)志性技術(shù)、產(chǎn)品和服務(wù)。《新一代人工智能產(chǎn)業(yè)創(chuàng)新重點任務(wù)揭榜工作方案》指出要研究人工智能支持產(chǎn)業(yè)發(fā)展,重點發(fā)展大數(shù)據(jù)驅(qū)動的類人智能技術(shù)方案,明確人工智能作為發(fā)展新—代信息技術(shù)的主要方向《“十三五”國家科技創(chuàng)新規(guī)劃》制定了一系列推動工業(yè)互聯(lián)網(wǎng)新型基礎(chǔ)設(shè)施建設(shè)量質(zhì)并進(jìn)的發(fā)展目標(biāo)。3月,《中華人民共和國國民經(jīng)濟(jì)和社會發(fā)展第十四個五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》(以下簡稱“綱要”)全文正式發(fā)布。在共19篇65章的綱要全文中,“智能”、“智慧”相關(guān)表述達(dá)57處。以人工智能為代表的新一代信息技術(shù),將成為我國十四五期間推動經(jīng)濟(jì)高質(zhì)量發(fā)展、建設(shè)創(chuàng)新型國家,實現(xiàn)新型工業(yè)化、信息化、城鎮(zhèn)化和農(nóng)業(yè)現(xiàn)代化的重要技術(shù)保障和核心驅(qū)動力之一。《工業(yè)互聯(lián)網(wǎng)創(chuàng)新發(fā)展行動計劃(2021-2023年)》經(jīng)濟(jì)環(huán)境03|經(jīng)濟(jì)環(huán)境除了政策層面的支持,人工智能作為新一輪產(chǎn)業(yè)變革的核心驅(qū)動力,正在釋放歷次科技革命和產(chǎn)業(yè)變革的巨大能量,將推動產(chǎn)業(yè)高質(zhì)量、現(xiàn)代化、智能化水平提升。2020年作為人工智能產(chǎn)業(yè)化元年,首個官方的人工智能數(shù)據(jù)中心在武漢開始運作,這是我國人工智能發(fā)展史上的里程碑事件,一場以人工智能為驅(qū)動的“智能經(jīng)濟(jì)”也正式走入大眾的視野。04|社會環(huán)境目前,我國人工智能行業(yè)發(fā)展走在世界前列,2019年中國人工智能行業(yè)市場規(guī)模約1300億元人民幣;2020年,人工智能產(chǎn)業(yè)迎來爆發(fā)期,經(jīng)濟(jì)規(guī)模超過1500億元;到2025年,人工智能產(chǎn)業(yè)規(guī)模將超過4500億元。中國有望成為世界上最大的人工智能市場,未來5年的年均復(fù)合增長率超40%,各人工智能企業(yè)場景落地應(yīng)用值得關(guān)注!我國知識圖譜的研究起步較晚,缺乏對知識圖譜理論的系統(tǒng)的研究,目前主要以應(yīng)用為主。知識圖譜應(yīng)用近年來在我的應(yīng)用迅速增多,其文獻(xiàn)分布于不同專業(yè)領(lǐng)域的期刊,實際應(yīng)用中涉及的學(xué)科范圍較廣,涵蓋了自然科學(xué)領(lǐng)域及社會科學(xué)領(lǐng)域的的部分學(xué)科,并有不斷朝其他學(xué)科滲透的趨勢。對繪制知識圖譜,并基于知識圖譜進(jìn)行情報研究目前已形成了一套較為成熟的方法。新形勢下,中國制造與人工智能相結(jié)合的智能制造孕育而生。智能制造是基于新一代信息通信技術(shù)與先進(jìn)制造技術(shù)深度融合,貫穿于設(shè)計、生產(chǎn)、管理、服務(wù)等制造活動的各個環(huán)節(jié),具有自感知、自學(xué)習(xí)、自決策、自執(zhí)行、自適應(yīng)等功能的新型生產(chǎn)方式。加快發(fā)展智能制造,是培育我國經(jīng)濟(jì)增長新動能的必由之路,是搶占未來經(jīng)濟(jì)和科技發(fā)展制高點的戰(zhàn)略選擇,對于推動我國制造業(yè)供給側(cè)結(jié)構(gòu)性改革,打造我國制造業(yè)競爭新優(yōu)勢,實現(xiàn)制造強(qiáng)國具有重要戰(zhàn)略意義。經(jīng)濟(jì)環(huán)境05|社會環(huán)境06|行業(yè)驅(qū)動因素知識圖譜是人工智能領(lǐng)域的重要基礎(chǔ)支撐技術(shù),自2015年起,中國政府相繼頒布一系列支持人工智能發(fā)展的相關(guān)政策,人工智能的關(guān)注度逐步提升。2015年,國務(wù)院頒布了《中國制造2025》、《關(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》,以“智能制造”和“互聯(lián)網(wǎng)+人工智能”為出發(fā)點,開始重點關(guān)注人工智能領(lǐng)域的發(fā)展布局,提出要加快人工智能核心技術(shù)突破,提高各行業(yè)的智能化水平。政策大力支持知識圖譜作為人工智能領(lǐng)域的重要基礎(chǔ)支撐技術(shù),是資本市場重點關(guān)注對象之一。在資本力量的推動下,一批以知識圖譜技術(shù)為核心的創(chuàng)業(yè)公司進(jìn)入到市場中,逐漸成為市場中的有力競爭者。除明略數(shù)據(jù),竹間智能、達(dá)觀數(shù)據(jù)、知因智慧、Plantdata等知識圖譜創(chuàng)業(yè)企業(yè)已完成B輪、A輪、天使輪等輪次的一級市場融資,鳥瞰智能也通過新三板上市獲得融資,充足的資金支持為初創(chuàng)型知識圖譜企業(yè)保駕護(hù)航,助推其進(jìn)一步升級發(fā)展。資本投入推動行業(yè)發(fā)展隨著科技發(fā)展進(jìn)步,高效化、智能化已成為社會發(fā)展的重要趨勢,而知識圖譜作為人工智能重要分支知識工程的具體應(yīng)用體現(xiàn),不僅能加深垂直應(yīng)用領(lǐng)域的智能化程度,還能為用戶降低運營成本、提高系統(tǒng)運作效率,切合社會高效化、智能化的發(fā)展需求。社會高效化、智能化的發(fā)展趨勢促使社會對知識圖譜技術(shù)的需求逐步提高,知識圖譜行業(yè)發(fā)展空間將逐步擴(kuò)大。社會高效化、智能化運作需求促進(jìn)行業(yè)發(fā)展充足的數(shù)據(jù)源是構(gòu)建高質(zhì)量知識圖譜的重要前提。目前,半結(jié)構(gòu)化、非結(jié)構(gòu)化、結(jié)構(gòu)化數(shù)據(jù)源均越來越豐富,成為助推知識圖譜行業(yè)發(fā)展的重要力量。在非結(jié)構(gòu)化數(shù)據(jù)方面,除網(wǎng)絡(luò)日志、網(wǎng)頁、社交網(wǎng)絡(luò)等傳統(tǒng)開放鏈接來源,傳感器、定位系統(tǒng)等物聯(lián)網(wǎng)感知設(shè)備亦逐漸成為知識圖譜的重要數(shù)據(jù)采集源,數(shù)據(jù)采集渠道進(jìn)一步拓寬。在半結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)方面,一批通用型開放鏈接知識庫項目發(fā)展迅速并逐步完善,如Freebase、Wikidata、DBpedia、YAGO等,這些知識庫主要由人工構(gòu)建,將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化成半結(jié)構(gòu)化或結(jié)構(gòu)化數(shù)據(jù),覆蓋面較廣,包含大量實體、關(guān)系、事實等數(shù)據(jù),是知識圖譜的重要數(shù)據(jù)來源。充足數(shù)據(jù)源助推行業(yè)發(fā)展03行業(yè)現(xiàn)狀分析Loremipsumdolorsitamet,consetetursadipscingelitr,seddiamnonumyeirmodtemporinviduntutlaboreetPART知識索引可將有價值的信息以自然語言的形式直接展現(xiàn)搜索引擎是互聯(lián)網(wǎng)發(fā)展中最具代表性的應(yīng)用之一,它解決了人們?nèi)绾畏奖惬@取信息的問題,一度成為大部分流量的入口。但隨著網(wǎng)絡(luò)中信息沉積越來越多,人們真正需要的,隱藏在大量無用信息中有價值的部分,我們稱之為知識的內(nèi)容,往往得不到直觀展現(xiàn),這成為了搜索引擎領(lǐng)域重點要解決的問題。2012年5月,谷歌率先提出知識圖譜概念,用以更好的描述現(xiàn)實世界中實體關(guān)聯(lián)性問題,進(jìn)而提高信息搜索中的知識獲取效率,隨后搜狗、微軟、百度紛紛推出相關(guān)概念架構(gòu),知識圖譜被視為下一代搜索引擎的核心技術(shù)。傳統(tǒng)搜索引擎一般采用網(wǎng)頁索引,按照“網(wǎng)頁--(預(yù)處理)--》臨時庫--(索引)--》索引好的庫--(由用戶行為觸發(fā)檢索)--》為用戶展示網(wǎng)頁結(jié)果”的流程執(zhí)行,信息源來自網(wǎng)頁,展現(xiàn)內(nèi)容也是網(wǎng)頁鏈接。而基于知識圖譜的搜索作為和網(wǎng)頁索引同級、并行的另一套知識索引,更注重信息間的關(guān)聯(lián)性和自然語言理解,通過圖存儲的形式從新組織互聯(lián)網(wǎng)中的信息,再以人類的語言習(xí)慣進(jìn)行查詢和展現(xiàn),從而提高搜索體驗,因為知識的存儲形式發(fā)生了變化,所以知識索引信息來源和展現(xiàn)載體都不再局限于網(wǎng)頁文字,語音交互和更加豐富的loT場景將會是未來的發(fā)展方向。03|行業(yè)現(xiàn)狀應(yīng)用NLP的知識抽取將成為知識搜索的重要破局點目前,互聯(lián)網(wǎng)上只有極少數(shù)知識被人工整理成了機(jī)器可以解析的格式,如各類百科欄目和垂直領(lǐng)域數(shù)據(jù)庫,這些資源支撐了當(dāng)下絕大部分通用知識圖譜的搭建,但這些信息也僅僅是滄海一粟,無論是覆蓋范圍、更新頻率、可靠程度都無法滿足日益增長的自動化和智能化需求,更嚴(yán)峻的是新—代互聯(lián)網(wǎng)用戶逐漸喪失了參與編輯的精神,甚至不知道可以編輯百科內(nèi)容,在此趨勢下基于百科的知識圖譜將會變成一種靜態(tài)數(shù)據(jù)留檔,其支撐的知識搜索也將會大量依賴于權(quán)威組織編輯,成本和效率將會成為致命傷,因此應(yīng)用準(zhǔn)確且自動化的NLP技術(shù),在更廣泛的網(wǎng)頁文本信息中,替代人工進(jìn)行知識抽取,成為了知識搜索領(lǐng)域重要的破局點。知識搜索引擎Magi提供了一種NLP+評價系統(tǒng)的半監(jiān)督學(xué)習(xí)方式,通過互聯(lián)網(wǎng)對有監(jiān)督學(xué)習(xí)的原始NLP模型進(jìn)行“放養(yǎng)式”訓(xùn)練,再由“一個知識點在不同表達(dá)中被印證,則證明其可信度較高”而形成的評價系統(tǒng)去收斂訓(xùn)練成果,從而完成較低成本,可持續(xù)的廣域下NLP模型訓(xùn)練,經(jīng)過搜索引擎M的公測體驗,以及B端知識抽取的定制服務(wù),Magi逐漸形成了獨立NLP產(chǎn)品的服務(wù)模式,為知識工程輕需求用戶,和知識圖譜搭建者提供了完善的RPA服務(wù)在中國知識圖譜產(chǎn)品市場中,百度百科、互動百科等通用知識圖譜庫逐步完善,關(guān)注度不斷提升,使知識圖譜技術(shù)進(jìn)一步得到認(rèn)可,而在行業(yè)知識圖譜產(chǎn)品方面,明略數(shù)據(jù)、達(dá)觀數(shù)據(jù)等一批以知識圖譜技術(shù)為核心的初創(chuàng)型企業(yè)注重在垂直領(lǐng)域深耕,研發(fā)出針對金融、客服、醫(yī)療等行業(yè)的定制化知識圖譜應(yīng)用產(chǎn)品,用戶數(shù)量不斷提高,加快知識圖譜產(chǎn)品商用化的發(fā)展步伐。根據(jù)沙利文數(shù)據(jù)顯示,中國知識圖譜行業(yè)市場規(guī)模從2014年的10.7億元增長至2018年的87.7億元,年復(fù)合增長率為69.1%。隨著知識圖譜技術(shù)的不斷完善、行業(yè)知識圖譜產(chǎn)品的種類不斷增多,知識圖譜產(chǎn)品的市場認(rèn)可度將逐步提高,各領(lǐng)域?qū)χR圖譜產(chǎn)品的需求也將不斷提升,有望推動行業(yè)進(jìn)一步規(guī)?;l(fā)展。04|行業(yè)市場規(guī)模技術(shù)發(fā)展遇瓶頸現(xiàn)階段,知識圖譜在信息抽取、知識表示、知識推理等方面面臨技術(shù)困難,技術(shù)瓶頸問題成為制約行業(yè)發(fā)展的關(guān)鍵因素之一。知識推理是提升知識圖譜智能化水平的關(guān)鍵環(huán)節(jié),而目前的知識圖譜產(chǎn)品在知識推理環(huán)節(jié)常出現(xiàn)推理知識準(zhǔn)確率低,冗余度高,邏輯性不強(qiáng)等問題,將推理得到的知識加入知識庫前通常還需對其進(jìn)行可證明性檢查、冗余性檢查等,知識推理技術(shù)水平仍較為薄弱。此外,知識庫融合、答案自動生成等知識圖譜發(fā)展需求也為知識推理技術(shù)帶來新的挑戰(zhàn),知識推理技術(shù)明顯滯后于知識圖譜發(fā)展需求,知識推理技術(shù)問題需得到進(jìn)一步重視方可逐步改善。05|行業(yè)痛點人工維護(hù)成本高目前,知識圖譜的多個構(gòu)建環(huán)節(jié)仍需大量人工參與,如本體構(gòu)建、知識推理、質(zhì)量評估、知識更新等環(huán)節(jié)。由于機(jī)器學(xué)習(xí)仍處于初步發(fā)展階段,知識圖譜構(gòu)建過程中的數(shù)據(jù)標(biāo)注、數(shù)據(jù)清洗、數(shù)據(jù)冗余度檢查、數(shù)據(jù)更新等工作仍需人為操作完成,人工維護(hù)成本較高,不利于行業(yè)發(fā)展。在本體構(gòu)建環(huán)節(jié),本體可由人工手動編輯和數(shù)據(jù)驅(qū)動自動生成兩種方法完成構(gòu)建。由于實體數(shù)據(jù)繁雜,采用人工手動編輯方法進(jìn)行本體構(gòu)建會造成工作量超負(fù)荷。而采用數(shù)據(jù)驅(qū)動自動生成方法進(jìn)行本體構(gòu)建,后期還需要經(jīng)過質(zhì)量評估和人工審核來修正和確認(rèn),效率相比人工手動編輯方法雖有所提高,但仍需大量人工參與才能完成,人工審核的維護(hù)成本較高。知識圖譜的知識更新仍主要由人工操作完成由于人的認(rèn)知能力不斷提高、知識量不斷增長,知識圖譜也需與時俱進(jìn),實現(xiàn)知識更新。而目前,知識圖譜的知識更新仍主要由人工操作完成,需要人工輸入數(shù)據(jù),人工定義規(guī)則,人工消除沖突等,實施難度較大,耗費大量人力,不利于行業(yè)發(fā)展。++單一的資金提供方角色僅能為知識圖譜行業(yè)企業(yè)提供“凈利差”的盈利模式,知識圖譜行業(yè)同質(zhì)化競爭日趨嚴(yán)重,利潤空間不斷被壓縮,企業(yè)業(yè)務(wù)收入因此受影響,商業(yè)模式亟待轉(zhuǎn)型除傳統(tǒng)的知識圖譜行業(yè)需求外,設(shè)備管理、服務(wù)解決方案、貸款解決方案、結(jié)構(gòu)化融資方案、專業(yè)咨詢服務(wù)等方面多方位綜合性的增值服務(wù)需求也逐步增強(qiáng)。中國本土知識圖譜行業(yè)龍頭企業(yè)開始在定制型服務(wù)領(lǐng)域發(fā)力,鞏固行業(yè)地位全面增值服務(wù)06|發(fā)展建議提升產(chǎn)品質(zhì)量(1)政府方面:政府應(yīng)當(dāng)制定行業(yè)生產(chǎn)標(biāo)準(zhǔn),規(guī)范知識圖譜行業(yè)生產(chǎn)流程,并成立相關(guān)部門,對科研用知識圖譜行業(yè)的研發(fā)、生產(chǎn)、銷售等各個環(huán)節(jié)進(jìn)行監(jiān)督,形成統(tǒng)一的監(jiān)督管理體系,完善試劑流通環(huán)節(jié)的基礎(chǔ)設(shè)施建設(shè),重點加強(qiáng)冷鏈運輸環(huán)節(jié)的基礎(chǔ)設(shè)施升級,保證知識圖譜行業(yè)產(chǎn)品的質(zhì)量,促進(jìn)行業(yè)長期穩(wěn)定的發(fā)展;(2)生產(chǎn)企業(yè)方面:知識圖譜行業(yè)生產(chǎn)企業(yè)應(yīng)嚴(yán)格遵守行業(yè)生產(chǎn)規(guī)范,保證產(chǎn)品質(zhì)量的穩(wěn)定性。目前市場上已有多個本土知識圖譜行業(yè)企業(yè)加強(qiáng)生產(chǎn)質(zhì)量的把控,對標(biāo)優(yōu)質(zhì)、高端的進(jìn)口產(chǎn)品,并憑借價格優(yōu)勢逐步替代進(jìn)口。此外,知識圖譜行業(yè)企業(yè)緊跟行業(yè)研發(fā)潮流,加大創(chuàng)新研發(fā)力度,不斷推出新產(chǎn)品,進(jìn)一步擴(kuò)大市場占有率,也是未來行業(yè)發(fā)展的重要趨勢。多元化融資渠道可持續(xù)公司債等創(chuàng)新產(chǎn)品,擴(kuò)大非公開定向債務(wù)融資工具(PPN)、公司債等額度獲取,形成了公司債、PPN、中期票據(jù)、短融、超短融資等多產(chǎn)品、多市場交替發(fā)行的新局面;企業(yè)獲取各業(yè)態(tài)銀行如國有銀行、政策性銀行、外資銀行以及其他中資行的授信額度,確保了銀行貸款資金來源的穩(wěn)定性。知識圖譜行業(yè)企業(yè)在保證間接融資渠道通暢的同時,能夠綜合運用發(fā)債和資產(chǎn)證券化等方式促進(jìn)自身融資渠道的多元化,降低對單一產(chǎn)品和市場的依賴程度,實現(xiàn)融資地域的分散化,從而降低資金成本,提升企業(yè)負(fù)債端的市場競爭力。以遠(yuǎn)東宏信為例,公司依據(jù)自身戰(zhàn)略發(fā)展需求,堅持“資源全球化”戰(zhàn)略,結(jié)合實時國內(nèi)外金融環(huán)境,有效調(diào)整公司直接融資和間接融資的分布結(jié)構(gòu),在融資成本方面與同業(yè)相比優(yōu)勢突出。04行業(yè)前景趨勢Loremipsumdolorsitamet,consetetursadipscingelitr,seddiamnonumyeirmodtemporinviduntutlaboreetPART01|行業(yè)發(fā)展趨勢知識圖譜和深度學(xué)習(xí)均是人工智能領(lǐng)域的重要基礎(chǔ)技術(shù),知識圖譜屬于知識工程分支,深度學(xué)習(xí)屬于機(jī)器學(xué)習(xí)分支。知識圖譜和深度學(xué)習(xí)從兩個方向?qū)崿F(xiàn)智能化,深度學(xué)習(xí)擅長解決端到端的問題,知識圖譜擅長處理知識類問題,曾就職于摩托羅拉、NTT、中國聯(lián)通等公司的知識圖譜研究專家表示,知識圖譜和深度學(xué)習(xí)協(xié)同并進(jìn)能實現(xiàn)技術(shù)互補(bǔ),是知識圖譜的重要發(fā)展思路之一。知識圖譜和深度學(xué)習(xí)融合發(fā)展區(qū)塊鏈技術(shù)具有去中心化、透明化等特點,在知識圖譜中運用區(qū)塊鏈技術(shù)能在知識來源管理、知識儲存和更新、知識產(chǎn)權(quán)保護(hù)等方面實現(xiàn)優(yōu)化,知識圖譜與區(qū)塊鏈技術(shù)相結(jié)合逐漸成為知識圖譜發(fā)展的重要趨勢。區(qū)塊鏈的最關(guān)鍵特征為去中心化,即不依靠中心管理節(jié)點,能實現(xiàn)數(shù)據(jù)的分布式記錄、存儲和更新。在知識圖譜中運用區(qū)塊鏈技術(shù)能實現(xiàn)多節(jié)點知識輸入、儲存和更新,讓廣大人群均能參與構(gòu)建知識庫。由群體智能發(fā)展而來的開放鏈接知識庫亦具有分布式儲存、更新數(shù)據(jù)的特征,而區(qū)塊鏈技術(shù)的去中心化特征更明顯,能使開放鏈接知識庫在更多分布節(jié)點獲取知識,知識量進(jìn)一步充實。知識圖譜與區(qū)塊鏈結(jié)合發(fā)展目前,知識圖譜技術(shù)已廣泛應(yīng)用于金融、醫(yī)療、客服等領(lǐng)域,其中以金融反欺詐應(yīng)用場景最為常見,而知識圖譜在工業(yè)、科研等領(lǐng)域的可適用性亦較高,應(yīng)用前景廣闊,發(fā)展?jié)摿τ写M(jìn)一步發(fā)掘。以石油行業(yè)為例,原油精煉過程中會出現(xiàn)較多突發(fā)情況,包括設(shè)備故障、意外停機(jī)等,這些突發(fā)情況會使原油面臨腐蝕風(fēng)險,而由于不同類型原油包含不同的化學(xué)成分,石油公司需要收集大量的石油精煉專業(yè)知識來應(yīng)對突發(fā)情況,如不同類型的原油如何適應(yīng)不同環(huán)境,如何處理石油避免腐蝕等。石油精煉專業(yè)知識主要由具有豐富行業(yè)經(jīng)驗的石油專家掌握,而隨著行業(yè)專家逐漸退休,石油精煉專業(yè)知識難以在工作團(tuán)隊中推廣和分享,在突發(fā)情況發(fā)生時,工程師無法得到專業(yè)的見解和知識來應(yīng)對事故風(fēng)險。利用知識圖譜技術(shù),石油公司可以建立石油精煉專業(yè)知識庫,將石油專家多年積累的專業(yè)知識進(jìn)一步結(jié)構(gòu)化,形成石油精煉專業(yè)知識網(wǎng)絡(luò),便于石油精煉專業(yè)知識在工作團(tuán)隊中推廣。突發(fā)情況發(fā)生時,工程師可根據(jù)原油類型、事故類型等信息從知識圖譜平臺中獲取事故應(yīng)對方案,有效應(yīng)對事故。應(yīng)用領(lǐng)域進(jìn)一步擴(kuò)展隨著ISO/IECJTC1/SC42、W3C、IEEE、全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會、國家人工智能標(biāo)準(zhǔn)化總體組等國內(nèi)外標(biāo)準(zhǔn)化組織或機(jī)構(gòu)對知識圖譜標(biāo)準(zhǔn)化的關(guān)注與推動,《知識圖譜技術(shù)架構(gòu)》等多項知識圖譜相關(guān)國際、國家標(biāo)準(zhǔn)獲得立項或提出討論。未來,知識圖譜領(lǐng)域基礎(chǔ)共性及關(guān)鍵技術(shù)標(biāo)準(zhǔn)將不斷涌現(xiàn),依托正在研制的知識圖譜技術(shù)架構(gòu)等標(biāo)準(zhǔn),通過聚焦核心標(biāo)準(zhǔn)化需求逐步建立基本的知識圖譜標(biāo)準(zhǔn)體系并孵化典型行業(yè)中的知識圖譜應(yīng)用標(biāo)準(zhǔn),形成國際標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)和團(tuán)體標(biāo)準(zhǔn)良性互動的局面。標(biāo)準(zhǔn)化趨勢中國知識圖譜行業(yè)主要由互聯(lián)網(wǎng)巨頭旗下知識圖譜服務(wù)平臺、傳統(tǒng)解決方案商旗下知識圖譜服務(wù)平臺以及初創(chuàng)型知識圖譜服務(wù)平臺三類企業(yè)參與競爭,其中,互聯(lián)網(wǎng)巨頭旗下知識圖譜服務(wù)平臺處于較領(lǐng)先位置,如百度的“知心”、騰訊的“星圖”、阿里巴巴的商品知識圖譜等,而傳統(tǒng)解決方案商旗下知識圖譜服務(wù)平臺以及初創(chuàng)型知識圖譜服務(wù)平臺緊隨其后。02|行業(yè)競爭格局由于中國知識圖譜商業(yè)化應(yīng)用仍
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 焦作新材料職業(yè)學(xué)院《家具與陳設(shè)設(shè)計》2023-2024學(xué)年第一學(xué)期期末試卷
- 地下醫(yī)療設(shè)施打井施工合同
- 醫(yī)院電工施工合同
- 科研院所事業(yè)單位聘用合同模板
- 建筑助理招聘合同指南
- 2024節(jié)能設(shè)備采購合同范本
- 體育行業(yè)應(yīng)屆生勞動合同范本
- 區(qū)塊鏈行業(yè)試用期合同風(fēng)險防范
- 山東省2015年高中歷史第14課從中日甲午戰(zhàn)爭到八國聯(lián)軍侵華17岳麓版必修1
- 文化活動租賃合同樣本
- 2020年度全國煤礦安全事故統(tǒng)計
- DB2308T 220-2024陸基圓池(桶)+池塘循環(huán)水養(yǎng)殖技術(shù)規(guī)程
- 2024年中國PCB板清洗劑市場調(diào)查研究報告
- 《紙管》規(guī)范要求
- 【數(shù)學(xué)】2021-2024年新高考數(shù)學(xué)真題考點分布匯
- 2024年育嬰師合同協(xié)議書
- 2024年湖南省公務(wù)員錄用考試《行測》真題及答案解析
- 大班健康教案及教學(xué)反思《蜈蚣走路》
- 生活妝課件教學(xué)課件
- 延遲支付協(xié)議書范本-合同范本
- 2023-2024學(xué)年廣東省廣州市番禺區(qū)八年級(上)期末英語試卷
評論
0/150
提交評論